PARBOABOA - Meta dilaporkan sedang berupaya mengatasi masalah unik terkait penerjemahan bahasa tidak tertulis seperti Hokkien sebagai bagian dari program Meta's Universal Speech Translator (UST) yang bekerja untuk mengembangkan terjemahan speech-to-speech secara real-time sehingga penghuni Metaverse dapat lebih mudah berinteraksi.
Dilansir dari Engadget, Kamis (20/10), dari sekitar 7.000 bahasa yang dikenal di dunia, empat dari sepuluh di antaranya ada tanpa komponen tertulis.
Sedangkan, sistem terjemahan pembelajaran mesin biasanya memerlukan contoh bahasa yang luas dan dapat diberi label, baik tertulis maupun lisan, untuk dilatih.
Bahasa Hokkien adalah salah satu bahasa dari rumpun bahasa Min Selatan, yang berasal dari wilayah Minnan di China.
Hokkien bukanlah bahasa yang dapat digunakan secara tertulis, melainkan hanya bisa diucapkan secara verbal.
Mark Zuckerberg selaku CEO Meta telah melakukan simulasi sistem penerjemah bahasa Hokkien ini, bersama dengan software engineer, Peng-Jen Chen pada awal Oktober lalu.
Dalam video singkat berdurasi 1 menit 10 detik yang diunggah Zuckerberg ke akun Facebook pribadinya, terlihat Peng-Jen berbicara dengan Zuckerberg atau yang akrab disapa Zuck menggunakan bahasa Hokkien.
Setelah selesai berbicara, sistem penerjemah secara otomatis mengubah bahasa Hokkien tersebut menjadi bahasa Inggris.
Sebaliknya, saat Zuck menjawab pertanyaan Chen, sistem kembali menerjemah bahasa Inggris ke bahasa Hokkien.
Menurut Meta, bahasa Hokkien dikenal sebagai “bahasa sumber daya rendah”, yang berarti ketersediaan data pelatihan yang tersedia untuk bahasa tersebut tidak mencukupi dibandingkan dengan bahasa Spanyol atau Inggris.
Selain itu, ada relatif sedikit penerjemah manusia bahasa Inggris-ke-Hokkien, sehingga sulit untuk mengumpulkan dan membubuhi keterangan data.
Untuk mengatasi tantangan tersebut, peneliti Meta menggunakan teks yang ditulis dalam bahasa Mandarin, yang mirip dengan bahasa Hokkien, sebagai perantara antara bahasa Inggris dan bahasa Hokkien saat melatih AI-nya. Tim juga bekerja sama dengan pembicara Hokkien untuk memastikan terjemahannya benar.
"Kami pertama-tama menerjemahkan pidato bahasa Inggris (atau Hokkien) ke teks Mandarin, dan kemudian kami menerjemahkannya ke bahasa Hokkien (atau bahasa Inggris) dan menambahkannya ke data pelatihan," lanjutnya.
Saat ini, sistem tersebut memungkinkan seseorang yang berbicara Hokkien untuk berkomunikasi dengan seseorang yang berbicara bahasa Inggris, meskipun dengan kaku.
Model tersebut hanya dapat menerjemahkan satu kalimat penuh pada satu waktu, tetapi Zuckerberg yakin bahwa teknik tersebut pada akhirnya dapat diterapkan ke lebih banyak bahasa dan akan meningkat hingga menawarkan terjemahan real-time.
Selain model dan data pelatihan sudah Meta jadikan sumber terbuka dari proyek ini, perusahaan juga merilis sistem pembandingan terjemahan speech-to-speech pertama dari jenisnya berdasarkan korpus pidato Hokkien yang disebut Taiwanese Across Taiwan serta matriks ucapan.