Apakah chatbot misteri ini benar-benar GPT-4.5 yang menyamar? Inilah cara melihatnya sendiri

Fotografer Francesco Carta/Getty Images

Sejak peluncuran ChatGPT, OpenAI terus mengerjakan proyek AI baru yang membangun kesuksesan dan popularitas chatbot AI-nya. Kini, kemunculan chatbot misteri baru memberikan gambaran kepada publik tentang proyek terbarunya — dan ini sangat mengesankan.

Minggu lalu, chatbot baru bernama “gpt2-chatbot” muncul di Chatbot Arena, sebuah platform sumber terbuka yang digunakan untuk membandingkan kinerja model bahasa besar (LLM) terbaru.

Selain itu: Google memang benar khawatir: OpenAI dilaporkan ingin memasuki pasar pencarian

Kemunculan chatbot ini cukup menimbulkan kehebohan karena kemampuannya yang mengesankan, yang telah mengungguli banyak LLM terpopuler di pasaran, seperti Gemini, Claude, dan bahkan GPT-4. Namun, banyak yang kecewa karena gpt2-chatbot telah dihapus dari Chatbot Arena tak lama setelah muncul di platform.

Mulai tadi malam, jika Anda mengunjungi Chatbot Arena, Anda akan menemukan dua varian chatbot asli, masing-masing disebut, ‘im-a-good-gpt2-chatbot’ dan ‘im-also-a-good-gpt2 -bot obrolan’.

Meskipun kedua model tersebut menyandang gelar “GPT” yang eksklusif untuk keluarga LLM Generative Pre-trained Transformer (GPT) OpenAI, perusahaan tersebut belum secara resmi mengakui bahwa mereka sedang mengerjakan model tersebut. Namun, CEO OpenAI Sam Altman menulis postingan samar di X yang hanya menyebutkan nama LLM, “im-a-good-gpt2-chatbot,” yang sepertinya mengonfirmasi hubungan antara OpenAI dan modelnya, seperti terlihat di bawah.

Meskipun modelnya tersedia di Chatbot Arena, mengaksesnya cukup rumit. Jika Anda melihat daftar LLM yang didukung oleh Chatbot Arena, Anda tidak akan melihat model yang tercantum di sana. Akibatnya, Anda tidak akan dapat mengujinya di perbandingan Chatbot Arena (berdampingan) karena tidak disertakan dalam dropdown.

Sebaliknya, jika Anda ingin mengaksesnya, Anda harus terus memulai perbandingan Arena (pertempuran) — yang secara acak memilih dua LLM untuk bersaing satu sama lain — hingga salah satu dari dua model baru muncul. Butuh waktu lima putaran hingga akhirnya muncul, seperti terlihat di bawah. Namun, jika Anda bertekad untuk mengujinya sendiri, penantiannya mungkin sepadan.

Arena Chatbot

Setelah model terungkap dan Anda melihat bahwa model tersebut adalah “im-a-good-gpt2-chatbot” atau “im-also-a-good-gpt2-chatbot”, Anda dapat terus mengobrol dengannya dengan menambahkan pertanyaan baru untuk mengujinya. kemampuan untuk diri Anda sendiri. Anda dapat terus mengobrol hingga Anda memutuskan untuk memulai babak baru atau menyegarkan.

Selain itu: Keempat fitur Copilot untuk Microsoft 365 baru ini membuat penulisan cepat seperti seorang profesional menjadi lebih mudah

Orang-orang menggunakan X untuk berbagi kemampuan model anonim baru yang mengesankan, termasuk membuat klon Flappy Bird dengan satu perintah, membuat penerjemah kode yang menggunakan Claude Opusdan bahkan penalaran melalui pertanyaan fisika dasar.

Peningkatan ini membuat orang berspekulasi bahwa model tersebut adalah GPT-5 atau GPT-4.5 OpenAI, yang dirilis dengan nama samaran sehingga OpenAI dapat mengukur kinerjanya secara akurat. Saat pengguna bertanya kepada “im-a-good-gpt2-chatbot” model LLM apa yang digunakan, chatbot tersebut menjawab, “Saya didasarkan pada arsitektur GPT-4, khususnya varian GPT-4.5.”

Namun, tidak ada jaminan bahwa ini bukan akibat halusinasi; sampai OpenAI mengonfirmasi apa pun, yang terbaik adalah berhati-hati saat menggunakan chatbot. Namun, jika Anda sedikit penasaran, saya anjurkan Anda untuk mencobanya karena gratis.