3. Biaya Token yang Rendah
Untuk mode Standard, biayanya hanya sekitar $0,10 per juta token input dan $0,40 untuk output.
Meskipun mode Thinking memiliki biaya lebih tinggi karena proses penalaran tambahan, model ini tetap efisien untuk tugas-tugas berat dengan kebutuhan latensi rendah, seperti penerjemahan bahasa dan klasifikasi teks.
4. Multi-modal dan Hybrid Reasoning
Gemini 2.5 Flash Lite mendukung input teks, audio, gambar, dan video. Pengembang dapat mengatur “thinking budget” seberapa lama model harus berpikir—untuk menyeimbangkan kecepatan, biaya, dan kualitas jawaban .
Mengapa Ini Penting?
• Ideal untuk tugas ringan tapi volume tinggi, seperti chatbot, ringkasan otomatis, atau analisis data berkelanjutan.
• Performa reasoning tetap tinggi padahal biaya jauh lebih rendah.
• Dukungan multimodal membuka potensi baru untuk aplikasi audio/visual/teks terpadu.