Tagihan AI Membengkak?, Inilah Cara Raksasa Teknologi Menjinakkan Biaya Token

Implementasi model AI tingkat lanjut dan alat agentic AI kini menjadi pedang bermata dua bagi perusahaan.Teknologi ini memang menawarkan efisiensi tinggi, tetapi di sisi lain, penggunaan token, unit pengukuran standar dalam layanan AI yang melonjak drastis mulai menguras anggaran.

Para eksekutif pun dipaksa berpikir keras, bagaimana mengendalikan biaya operasional yang terus meroket?.

Merespons tekanan ini, sejumlah raksasa teknologi mulai merancang mekanisme baru untuk menciptakan transparansi dan prediktabilitas pengeluaran.

Inovasi Model Penagihan

Oracle bergerak cepat. Dalam laporan pendapatan kuartal keempat 2026, CEO Mike Sicilia mengumumkan peluncuran terbatas paket token (token bundles) bagi pelanggan, sebuah langkah agar harga agentic AI lebih selaras dengan nilai bisnis yang dihasilkan.

Sejauh ini 33 pelanggan telah mencoba sistem tersebut. Menurut Sicilia, skema pembelian di muka (upfront) memungkinkan perusahaan menggunakan token lintas aplikasi dengan biaya yang jauh lebih terukur.

“Semua ini membantu pelanggan kami mengendalikan biaya dan menyelaraskan pengeluaran mereka dengan nilai yang dihasilkan,” ujarnya kepada para investor.

SAP mengambil langkah serupa. Philipp Herzig (Global CTO sekaligus Chief AI Officer SAP) mengungkapkan bahwa perusahaan terus mengembangkan mekanisme harga unit AI untuk layanan premium, termasuk kebutuhan agentic AI. Herzig menunjuk masalah mendasar yang kerap muncul di lapangan yaitu penggunaan token yang tidak terkendali.

“Masalah terbesarnya adalah orang menghabiskan banyak token,” jelas Herzig, merujuk pada kebiasaan pengembang membangun agen AI tanpa target yang jelas atau perhitungan return on investment (ROI) yang matang.

Transparansi di Tengah Pergeseran Model Bisnis

Vendor lain pun berlomba menawarkan solusi pemantauan pengeluaran. AWS mengumumkan pratinjau publik AWS FinOps Agent yang dirancang untuk mendeteksi anomali biaya. Flexera, di sisi lain, meluncurkan platform Flexera One, solusi manajemen biaya AI yang memberikan visibilitas pengeluaran di seluruh agen, model, dan sumber daya komputasi.

Bagi J.R. Storment (Direktur Eksekutif FinOps Foundation) mengungkapkan pergeseran ini bukan sekadar tren. Dalam pidato utamanya di konferensi FinOps X, ia menyebutnya sebagai perubahan fundamental model bisnis perangkat lunak. Industri kini beralih dari lisensi tradisional menuju model konsumsi berbasis penggunaan.

Storment juga menegaskan bahwa era subsidi AI, di mana vendor menanggung biaya agar perusahaan mau mencoba teknologi baru sudah berakhir. Kini, perusahaan harus menghadapi realitas biaya operasional yang sesungguhnya.

Sebagai gambaran skala konsumsinya, CEO OpenAI Sam Altman pernah mengungkapkan bahwa pelanggan dengan penggunaan tertinggi bisa menghabiskan hingga 100 juta token setiap bulan.

Tantangan bagi Pemimpin Teknologi

Masalah utama yang dihadapi para pemimpin teknologi saat ini adalah minimnya pemahaman mendalam tentang konsumsi token mereka sendiri yang terjadi di berbagai lapisan tech stack, mulai dari pusat data hingga edge computing.

Beberapa perusahaan sudah mengambil tindakan konkret. Shutterstock, misalnya, kini mewajibkan seluruh pengeluaran AI disalurkan melalui tim FinOps demi transparansi yang lebih ketat.

Sementara itu, Linux Foundation dan FinOps Foundation baru saja membentuk Tokenomics Foundation, sebuah organisasi yang akan mempertemukan pengembang model AI, konsumen token skala besar, dan penyedia layanan cloud untuk menyusun standar pemantauan penggunaan token dan biaya AI perusahaan.

Pada akhirnya, fokus jajaran direksi kini telah bergeser yaitu dari antusiasme terhadap teknologi menuju pembuktian nilai bisnis yang nyata.

Seperti yang ditegaskan Storment, “Pertanyaan berikutnya yang mulai diajukan oleh ruang rapat adalah, ‘Apa nilai dari semua kecerdasan ini, mengapa sangat mahal, dan apakah saya mendapatkan imbal balik yang cukup darinya?'”

Baca Juga

Bukan Membantu, AI Justru Menambah Beban Kerja Karyawan?

Berdasarkan data Glean, hanya 27 persen dari total waktu interaksi dengan AI yang digunakan untuk membangun agen AI atau mempelajari inovasi baru. Selebihnya, waktu karyawan habis terkuras untuk tugas-tugas administratif teknis yang tidak produktif.