Tahun lalu, bumi baru mulai membayangkan gimana teknologi AI generatif dapat mentransformasi upaya — dan saat ini, transformasi tersebut sedang melangkah dengan baik. Di Google, misi kami juga sama: menjadikan AI berfaedah bagi semua orang, meningkatkan taraf hidup orang sebanyak mungkin.



Dunia nan didukung pemasok AI dan terhubung ke Cloud



Dengan seluruh portofolio AI kami – infrastruktur, Gemini, model, Vertex AI – customer dan mitra membangun pemasok AI nan semakin canggih nan melayani customer, mendukung karyawan, dan membantu mereka membikin konten, dan banyak lagi.



Agen Customer yang dahsyat dapat membantu customer berinteraksi dengan upaya Anda secara lebih lancar dengan bekerja di beragam saluran - web, seluler, pusat panggilan, dan tempat penjualan - dan dalam beragam cara, seperti teks, suara, dan banyak lagi.

  • IHG Hotel & Resorts memperkenalkan keahlian perencanaan perjalanan AI generatif untuk memudahkan tamu merencanakan liburan mereka selanjutnya. 

  • Target mengoptimalkan penawaran dan jasa ‘curbside pickup’ pada aplikasi Target dan Target.com.



Agen Karyawan membantu semua tenaga kerja Anda menjadi lebih produktif dan bekerja sama dengan lebih baik. Misalnya:

  • Etsy menggunakan training Vertex AI untuk mengoptimalkan rekomendasi pencarian dan model iklan mereka, memberikan daftar rekomendasi nan lebih baik kepada pembeli dan meningkatkan penjualan.

  • Dasa di Brasil membantu master mendeteksi temuan nan relevan pada hasil tes dengan lebih cepat.



Agen Kreatif dapat berkedudukan sebagai desainer dan tim produksi terbaik - bekerja di seluruh gambar, slide, dan menjelajahi konsep berbareng Anda. Kami menyediakan platform dan tumpukan paling kuat untuk membangun pemasok kreatif. Misalnya:

  • Canva menggunakan Vertex AI untuk mendukung Magic Design for Video, membantu pengguna membikin video menarik dalam hitungan detik.

  • Carrefour menggunakan Vertex AI, mereka bisa membikin kampanye pemasaran bergerak di beragam jejaring sosial dalam hitungan minggu, bukan bulan.  



Berikut adalah penemuan produk nan kami umumkan di Cloud Next '24 untuk membantu organisasi dari semua skala membuka jalan baru menuju era AI.




Skala dengan prasarana nan dioptimalkan menggunakan AI


Potensi gen AI untuk mendorong transformasi nan sigap hanya bakal sekuat prasarana nan mendukungnya. Kami membikin kemajuan krusial untuk mendukung customer di setiap lapisan:

  • A3 mega: Dikembangkan dengan NVIDIA menggunakan H100 Tensor Core GPU, model baru berbasis GPU ini tersedia secara umum dan memberikan bandwidth dua kali lipat per GPU dibandingkan model A3 sebelumnya, untuk mendukung beban kerja nan paling berat. Kami juga mengumumkan Confidential A3, nan memungkinkan customer untuk melindungi kerahasiaan dan integritas info sensitif serta beban kerja AI selama training dan konklusi dengan lebih baik.

  • NVIDIA HGX B200 and NVIDIA GB200 NVL72: Chip platform NVIDIA Blackwell terbaru bakal datang di Google Cloud pada awal 2025 dalam dua variasi: HGX B200 dan GB200. B200 dirancang untuk training dan penyajian arus utama, sedangkan GB200 NVL72 mendukung konklusi model bahasa besar real-time dan performa training skala besar untuk model skala triliunan parameter.

  • TPU v5p: Kami mengumumkan kesiapan TPU v5p, akselerator AI kami nan paling kuat, dapat diskalakan, dan elastis untuk training dan inferensi, dengan daya komputasi 4X per pod dibandingkan dengan generasi sebelumnya. Kami juga mengumumkan kesiapan support Google Kubernetes Engine (GKE) untuk TPU v5p. Selama setahun terakhir, penggunaan GPU dan TPU di GKE telah tumbuh lebih dari 900%.

  • Opsi penyimpanan nan dioptimalkan dengan AI: Kami tengah mendorong kecepatan training dengan fitur caching baru di Cloud Storage FUSE dan Parallelstore, nan menyimpan info lebih dekat dengan TPU alias GPU customer. Kami juga memperkenalkan Hyperdisk ML (dalam pratinjau), jasa penyimpanan blok generasi terbaru kami nan mempercepat waktu pemuatan model hingga 3,7X dibandingkan dengan pengganti umum.

  • Opsi baru untuk Dynamic Workload Scheduler: Mode almanak untuk agunan waktu mulai dan mulai elastis untuk penghematan nan dioptimalkan bakal membantu customer memastikan manajemen sumber daya nan efisien untuk pengedaran training kompleks dan pekerjaan inferensi.



Kami juga membawa AI ke tempat info dibuat dan digunakan - ke Edge, ke lingkungan nan terisolasi udara (air-gapped), ke Google Sovereign Cloud, dan Lintas-Cloud (Cross-Cloud). Kami memungkinkan AI di mana saja melalui Google Distributed Cloud (GDC), nan memungkinkan Anda memilih lingkungan, konfigurasi, dan kontrol nan paling sesuai dengan kebutuhan spesifik organisasi Anda. Misalnya, penyedia jasa seluler terkemuka Orange, nan beraksi di 26 negara nan mengharuskan info lokal disimpan di setiap negara, memanfaatkan AI di GDC untuk meningkatkan keahlian jaringan dan menyempurnakan pengalaman customer.



Hari ini kami mengumumkan sejumlah keahlian baru di GDC, termasuk:

  • GPU NVIDIA ke GDC: Kami menghadirkan GPU NVIDIA ke GDC untuk konfigurasi terhubung dan air-gapped alias celah udara. Masing-masing bakal mendukung instance berbasis GPU baru untuk menjalankan model AI secara efisien.

  • GKE di GDC: Teknologi GKE nan sama nan digunakan oleh perusahaan AI terkemuka di Google Cloud bakal tersedia di GDC.

  • Mendukung Model AI: Kami memungkinkan beragam model AI terbuka, termasuk Gemma, Llama, dan lainnya pada GDC untuk dijalankan di lingkungan dengan celah udara dan edge nan terhubung.

  • Pencarian Vektor di GDC: Kami juga menghadirkan kekuatan Pencarian Vektor untuk memungkinkan pencarian dan pengambilan info di GDC untuk info pribadi dan sensitif Anda dengan latensi nan sangat rendah.

  • Sovereign Cloud: Untuk memenuhi persyaratan izin nan paling ketat, kami menghadirkan GDC dalam konfigurasi air-gapped dengan operasi lokal, keahlian memperkuat hidup penuh, dikelola oleh Google alias melalui mitra pilihan Anda. Anda mempunyai kendali penuh, dan ketika peraturan berubah, kami mempunyai elastisitas untuk membantu Anda merespons dengan cepat.



Meskipun tidak semua beban kerja merupakan beban kerja AI, setiap beban kerja nan Anda jalankan di cloud memerlukan pengoptimalan dan setiap aplikasi mempunyai kebutuhan teknis nan unik. Itu sebabnya kami memperkenalkan opsi komputasi baru untuk beragam keperluan nan membantu customer memaksimalkan kinerja, memungkinkan interoperabilitas antar aplikasi, dan memenuhi tujuan keberlanjutan, sekaligus menurunkan biaya.

  • Google Axion: CPU berbasis ArmⓇ pertama kami nan dirancang untuk pusat data, memberikan keahlian hingga 50% lebih baik dan efisiensi daya hingga 60% lebih baik dibandingkan instans berbasis x86 generasi saat ini nan sebanding.

  • Kami juga mengumumkan N4 dan C4, dua seri mesin baru dalam portofolio VM tujuan umum kami; corak mesin bare-metal original dalam Keluarga Mesin C3; kesiapan umum Hyperdisk Advanced Storage Pools, dan banyak lagi.



Kami juga memperluas residensi info untuk info nan disimpan saat tidak digunakan untuk AI Generatif pada jasa Vertex AI ke 11 negara baru: Australia, Brasil, Finlandia, Hong Kong, India, Israel, Italia, Polandia, Spanyol, Swiss, dan Taiwan.  

  • Selain itu, customer sekarang dapat membatasi pemrosesan pembelajaran mesin di Amerika Serikat alias Uni Eropa saat menggunakan Gemini 1.0 Pro dan Imagen.

  • Bergabung dengan 10 negara lain nan kami umumkan tahun lampau , area baru ini memberi customer kontrol lebih besar terhadap letak penyimpanan info mereka dan langkah mengaksesnya, sehingga memudahkan customer untuk memenuhi persyaratan peraturan dan keamanan di seluruh dunia.




http://1.bp.blogspot.com/-mX0dxJxp8dg/Vo8MSdxypWI/AAAAAAAARsI/EjaFhvgAEgc/s1600/Beutler_Google_Giftwrap_-v2TW.png -->