가성비 모델 ‘제미나이 플래시’ > 공지사항

본문 바로가기
사이트 내 전체검색

공지사항

가성비 모델 ‘제미나이 플래시’

페이지 정보

profile_image
작성자 onion
댓글 0건 조회 7회 작성일 25-04-10 17:02

본문

가성비 모델 ‘제미나이 플래시’ 가성비 모델 ‘제미나이 플래시’ 공개동일 비용에 GPT-4o 대비 2배 성능AI 전용 칩 ‘아이언우드’로 생태계 강화토마스 쿠리안 구글 클라우드 CEO가 '구글 클라우드 넥스트 2025' 현장에서 기조 연설을 진행하고 있다. 구글 클라우드 제공 구글이 성능과 효율을 앞세운 인공지능(AI) 모델과 칩을 동시에 공개하며 차세대 AI 컴퓨팅 시대를 선언했다. 효율성을 앞세워 경쟁력을 높이고, 자체 반도체로 엔비디아 의존도를 줄이려는 의도로 풀이된다. 9일(현지시간) 구글클라우드는 미국 라스베이거스에서 연례 행사인 '넥스트 2025'를 개최하고 지난달 공개한 최신 대형언어모델(LLM) 제미나이 2.5의 보급형 모델인 '제미나이 2.5 플래시'를 공개했다.'제미나이 2.5 플래시'는 빠른 추론과 낮은 지연시간을 앞세운 실용형 모델로 문서 분석, 고객 상담, 실시간 정보 처리 등 대량 트래픽을 감당해야 하는 서비스에 적합하다. 복잡한 프롬프트에는 보다 정확하게 간단한 요청엔 더욱 빠르게 반응하는 유연한 구조가 특징이다. 이로 인해 낮은 비용으로 빠른 서비스가 가능하다. '제미나이 2.5 플래시' 현재 버텍스 AI 플랫폼에서 미리보기 형태로 공개됐으며 향후 기업의 온프레미스 환경에서도 사용할 수 있도록 구글 분산형 클라우드(GDC) 기반으로 확대될 예정이다. 구글클라우드는 플래시가 자사 'AI 하이퍼컴퓨터' 환경에서 구동할 경우 1달러당 GPT-4o의 2배, 딥시크-R1의 5배 성능을 낸다고 강조했다.토마스 쿠리안 구글클라우드 최고경영자(CEO)는 "'플래시'는 프롬프트의 복잡성에 따라 추론의 깊이를 조정하고, 예산에 따라 성능을 제어할 수 있다"며 "일상적 사용사례에 더 적합해졌다"고 말했다. 구글클라우드는 이날 추론에 특화된 7세대 텐서처리장치(TPU) '아이언우드'도 공개했다. AI 딥러닝에 최적화된 칩으로 챗봇, 코드, 미디어 콘텐츠 생성 등 AI 처리 용량에 맞게 확장할 수 있도록 설계됐다.회사는 아이언우드 성능을 직전 세대 대비 10배 이상 끌어올렸다고 밝혔다. 고대역폭메모리(HBM)를 대거 탑재해 연산 과정에서 데이터를 자주 옮기는 비효율을 줄였고 칩 하나하나를 포드(Pod) 단위로 묶어 대규모 모가성비 모델 ‘제미나이 플래시’ 공개동일 비용에 GPT-4o 대비 2배 성능AI 전용 칩 ‘아이언우드’로 생태계 강화토마스 쿠리안 구글 클라우드 CEO가 '구글 클라우드 넥스트 2025' 현장에서 기조 연설을 진행하고 있다. 구글 클라우드 제공 구글이 성능과 효율을 앞세운 인공지능(AI) 모델과 칩을 동시에 공개하며 차세대 AI 컴퓨팅 시대를 선언했다. 효율성을 앞세워 경쟁력을 높이고, 자체 반도체로 엔비디아 의존도를 줄이려는 의도로 풀이된다. 9일(현지시간) 구글클라우드는 미국 라스베이거스에서 연례 행사인 '넥스트 2025'를 개최하고 지난달 공개한 최신 대형언어모델(LLM) 제미나이 2.5의 보급형 모델인 '제미나이 2.5 플래시'를 공개했다.'제미나이 2.5 플래시'는 빠른 추론과 낮은 지연시간을 앞세운 실용형 모델로 문서 분석, 고객 상담, 실시간 정보 처리 등 대량 트래픽을 감당해야 하는 서비스에 적합하다. 복잡한 프롬프트에는 보다 정확하게 간단한 요청엔 더욱 빠르게 반응하는 유연한 구조가 특징이다. 이로 인해 낮은 비용으로 빠른 서비스가 가능하다. '제미나이 2.5 플래시' 현재 버텍스 AI 플랫폼에서 미리보기 형태로 공개됐으며 향후 기업의 온프레미스 환경에서도 사용할 수 있도록 구글 분산형 클라우드(GDC) 기반으로 확대될 예정이다. 구글클라우드는 플래시가 자사 'AI 하이퍼컴퓨터' 환경에서 구동할 경우 1달러당 GPT-4o의 2배, 딥시크-R1의 5배 성능을 낸다고 강조했다.토마스 쿠리안 구글클라우드 최고경영자(CEO)는 "'플래시'는 프롬프트의 복잡성에 따라 추론의 깊이를 조정하고, 예산에 따라 성능을 제어할 수 있다"며 "일상적 사용사례에 더 적합해졌다"고 말했다. 구글클라우드는 이날 추론에 특화된 7세대 텐서처리장치(TPU) '아이언우드'도 공개했다. AI 딥러닝에 최적화된 칩으로 챗봇, 코드, 미디어 콘텐츠 생성 등 AI 처리 용량에 맞게 확장할 수 있도록 설계됐다.회사는 아이언우드 성능을 직전 세대 대비 10배 이상 끌어올렸다고 밝혔다. 고대역폭메모리(HBM)를 대거 탑재해 연산 과정에서 데이터를 자주 옮기는 비효율을 줄였고 칩 하나하나를 포드(Pod) 단위로 묶어 대규모 모델을 안정적으로 학습·추론할 수 있도록 했다. 이전 세대보다 메모리 용량은 가성비 모델 ‘제미나이 플래시’

댓글목록

등록된 댓글이 없습니다.

회원로그인

회원가입

사이트 정보

회사명 : 회사명 / 대표 : 대표자명
주소 : OO도 OO시 OO구 OO동 123-45
사업자 등록번호 : 123-45-67890
전화 : 02-123-4567 팩스 : 02-123-4568
통신판매업신고번호 : 제 OO구 - 123호
개인정보관리책임자 : 정보책임자명

접속자집계

오늘
5,648
어제
7,986
최대
8,491
전체
217,096
Copyright © 소유하신 도메인. All rights reserved.