뉴스/정보
Gemini 1.5 Flash, 8월 12일부터 가격 80% 인하
작성자
하이룽룽
작성일
2024-08-02 09:33
조회
1093
https://cloud.google.com/blog/products/ai-machine-learning/lower-costs-more-languages-for-gemini-on-vertex
Gemini 1.5 Flash를 개선하여 2024년 8월 12일부터 입력 비용을 최대 ~85%, 출력 비용을 최대 ~80%까지 줄였습니다 . 컨텍스트 캐싱과 같은 기능과 결합하면 긴 컨텍스트 쿼리의 비용과 지연 시간을 크게 줄일 수 있습니다. 표준 요청 대신 Batch API를 사용하면 지연 시간이 많은 작업에 대한 비용을 더욱 최적화할 수 있습니다. 이러한 장점을 결합하면 방대한 워크로드를 처리하고 100만 토큰 컨텍스트 창을 활용할 수 있습니다.
Google Cloud는 Gemini 1.5 Flash의 가격이 Vertex AI에서 약 80% 인하되어 GPT4o mini보다 텍스트의 경우 약 50% 저렴해질 것이라고 발표했습니다. 이미지 및 비디오 처리가 엄청나게 저렴해 보입니다.
Gemini 1.5 Flash를 개선하여 2024년 8월 12일부터 입력 비용을 최대 ~85%, 출력 비용을 최대 ~80%까지 줄였습니다 . 컨텍스트 캐싱과 같은 기능과 결합하면 긴 컨텍스트 쿼리의 비용과 지연 시간을 크게 줄일 수 있습니다. 표준 요청 대신 Batch API를 사용하면 지연 시간이 많은 작업에 대한 비용을 더욱 최적화할 수 있습니다. 이러한 장점을 결합하면 방대한 워크로드를 처리하고 100만 토큰 컨텍스트 창을 활용할 수 있습니다.
Google Cloud는 Gemini 1.5 Flash의 가격이 Vertex AI에서 약 80% 인하되어 GPT4o mini보다 텍스트의 경우 약 50% 저렴해질 것이라고 발표했습니다. 이미지 및 비디오 처리가 엄청나게 저렴해 보입니다.
전체 0