Apple mendakwa bahawa model AI untuk inferens mempunyai keupayaan terhad dan tidak dapat menghasilkan hasil yang tepat melebihi kerumitan tertentu.
Apple Inc mengeluarkan kertas penyelidikan pada hujung minggu yang mendakwa bahawa model AI untuk penaakulan mempunyai keupayaan terhad dan gagal menghasilkan keputusan yang tepat melebihi kerumitan tertentu.
Dalam kertas kerja bertajuk "The Illusion of Thinking: Understanding the Strengths and Limitation of Reasoning Models through the Lens of Problem Complexity," penyelidik Apple (NASDAQ:AAPL) berkata bahawa model penaakulan yang lebih besar (LRM) mempunyai jurang yang ketara dalam kualiti penaakulan dan gagal untuk membangunkan keupayaan menyelesaikan masalah umum.
Para penyelidik menguji model LRM termasuk O1/o3 OpenAI, DeepSeek-R1, Claude 3.7 Sonnet Thinking dan Gemini Thinking , menilai mereka dengan masalah peningkatan kerumitan dan sisihan daripada penanda aras ujian AI standard.
Menggunakan "persekitaran teka-teki terkawal" untuk menguji model, penyelidik Apple mendapati bahawa prestasi LRM merosot apabila kerumitan meningkat, akhirnya jatuh kepada ketepatan sifar pada kerumitan yang tinggi.
"Kami menunjukkan bahawa LRM yang canggih (cth, o3-mini, DeepSeek-R1, Claude-3.7-Sonnet-Thinking) masih gagal untuk membangunkan keupayaan penyelesaian masalah yang boleh digeneralisasikan, dengan ketepatan akhirnya menurun kepada sifar merentas persekitaran di luar tahap kerumitan tertentu, " tulis penyelidik Apple dalam kertas itu.
Para penyelidik berkata bahawa ujian mendedahkan bahawa LRM mengalami "ketidakcekapan asas" dan mempunyai batasan yang jelas dalam keupayaan mereka untuk skala. Para penyelidik juga mempersoalkan kaedah penilaian semasa untuk LRM berdasarkan penanda aras matematik yang telah ditetapkan, dan berkata mereka mereka bentuk pendekatan eksperimen yang lebih terkawal dengan menggunakan persekitaran teka-teki algoritma.
Para penyelidik Apple mempersoalkan dakwaan bahawa LRM adalah langkah penting ke arah AI umum - bentuk teori AI yang boleh mensimulasikan kebolehan kognitif yang luas dan kemahiran menyelesaikan masalah yang dipamerkan oleh manusia.
General AI telah lama dilihat sebagai matlamat utama oleh pembangun utama, walaupun ia kekal bersifat sangat teori. Model AI semasa, terutamanya model bahasa besar, menggunakan pengecaman corak untuk meramalkan perkataan seterusnya dalam urutan untuk menjana teks baharu, yang masih menyebabkan mereka terdedah kepada kadar ralat yang tinggi dan mengehadkan keupayaan penaakulan mereka.
Kertas kerja Apple dikeluarkan hanya beberapa hari sebelum Persidangan Pembangun Seluruh Dunia syarikat pada 9 Jun, di tengah-tengah jangkaan yang rendah kerana usaha AI syarikat jauh ketinggalan berbanding pesaingnya.
Walaupun bekerja dengan OpenAI untuk membolehkan ciri AI dalam peranti utamanya, Apple telah bergelut untuk menyampaikan keupayaan yang dijanjikan produk AInya, Apple Intelligence.