Studi: Chatgpt Lebih Akurat Jika Dihina, Tapi Jangan Tiru

Jan 18, 2026 08:35 PM - 4 bulan yang lalu 124932

Kincai Media – Sebuah studi terbaru dari University of Pennsylvania mengungkap temyata mengejutkan: memberikan perintah yang kasar alias apalagi menghina kepada ChatGPT justru dapat meningkatkan kecermatan jawabannya. Temuan ini bertolak belakang dengan kebiasaan banyak orang tua yang mengajarkan anak-anak untuk bersikap sopan kepada asisten digital seperti Alexa alias Siri.

Dalam penelitian yang belum melalui proses peer-review tersebut, dua peneliti menemukan bahwa saat perintah (prompt) untuk model ChatGPT-4o OpenAI semakin tidak sopan, output yang dihasilkan menjadi lebih tepat. Mereka merancang 50 pertanyaan dasar dari beragam subjek, lampau menulis ulang setiap pertanyaan lima kali dengan nada yang berbeda, mulai dari “sangat sopan” hingga “sangat kasar”.

“Kontra dari ekspektasi, prompt yang tidak sopan secara konsisten mengungguli yang sopan, dengan kecermatan berkisar dari 80,8 persen untuk prompt Sangat Sopan hingga 84,8 persen untuk prompt Sangat Kasar,” tulis para peneliti dalam makalahnya, seperti dilansir Fortune. Sementara itu, kecermatan untuk prompt paling sopan hanya mencapai 75,8 persen.

Konflik dengan Temuan Sebelumnya

Hasil penelitian ini tampak bertentangan dengan studi sebelumnya yang menyimpulkan bahwa bersikap lebih santun terhadap model bahasa besar (LLM) justru lebih efektif. Misalnya, sebuah makalah tahun 2024 oleh peneliti dari RIKEN Center for Advanced Intelligence Project dan Waseda University di Tokyo menemukan bahwa “prompt yang tidak sopan sering kali menghasilkan keahlian yang buruk.”

Penelitian lain dari Google DeepMind juga menunjukkan bahwa menggunakan prompt yang suportif dapat meningkatkan keahlian LLM dalam memecahkan soal matematika tingkat sekolah, mengisyaratkan informasi pelatihannya mungkin menangkap isyarat sosial, seperti seorang tutor online yang membimbing murid.

Perbedaan hasil ini menyoroti kompleksitas dan ketidakpastian dalam hubungan manusia-AI. Temuan dari Penn State juga menunjukkan bahwa perubahan sangat mini dalam pemilihan kata pada prompt dapat memberikan pengaruh dramatis pada kualitas output AI, yang berpotensi besar merusak prediktabilitas dan keandalan mereka yang sudah diragukan. Chatbot AI juga dikenal dapat memberikan jawaban yang sama sekali berbeda untuk prompt yang persis sama.

Peringatan dari Para Peneliti

Meski informasi menunjukkan untung dari sikap kasar, para peneliti dengan tegas tidak menganjurkannya. “Sementara temuan ini menarik secara ilmiah, kami tidak menganjurkan penerapan antarmuka yang berbeda alias toksik dalam aplikasi bumi nyata,” tulis mereka. “Menggunakan bahasa yang menghina alias merendahkan dalam hubungan manusia-AI dapat mempunyai pengaruh negatif pada pengalaman pengguna, aksesibilitas, dan inklusivitas, serta dapat berkontribusi pada norma komunikasi yang berbahaya.”

Pernyataan ini sejalan dengan kekhawatiran yang berkembang seputar akibat sosial dan psikologis dari teknologi AI generatif. Beberapa insiden fatal yang diduga dipicu oleh hubungan dengan ChatGPT telah memicu gugatan norma terhadap OpenAI, menyoroti potensi akibat dari sistem yang belum sepenuhnya dipahami.

Co-author studi sekaligus guru besar IT Penn State, Akhil Kumar, menekankan nilai dari antarmuka yang terstruktur. “Untuk waktu yang sangat lama, kita manusia menginginkan antarmuka percakapan untuk berinteraksi dengan mesin. Tetapi sekarang kita menyadari bahwa ada kerugian untuk antarmuka seperti itu juga, dan ada beberapa nilai dalam

Selengkapnya