Siriのポンコツぶりが露呈。スーパーボウルの基本問題で正答率わずか34%の低水準
Appleは新AI責任者を任命し改善を加速

Appleの音声アシスタント「Siri」に深刻な精度の問題が発覚した。スーパーボウルの歴史に関する基本的な質問で、わずか34%の正答率しか記録できなかったことが明らかになった。
テスト結果の詳細
One Foot Tsunamiのポール・カファシス氏が実施した体系的なテストでは、第1回から第58回までのスーパーボウルの優勝チームをSiriに質問。58回の質問のうち、正答はわずか20問だった。
特に深刻だったのは、フィラデルフィア・イーグルスについての回答だ。実際には1度しか優勝していないチームに対して、33回の優勝歴があると誤って回答。さらに、スーパーボウルXVIIからXXXIIまでの15回連続で誤答を続けるなど、致命的な欠陥を露呈した。
他のAIとの比較で浮き彫りになる問題点
Daring Fireballのジョン・グルーバー氏は、同じ質問をChatGPT、Kagi、DuckDuckGo、Googleに投げかけたところ、いずれも正確な回答を提供できたと報告。Apple Intelligenceを搭載した新しいSiriが、むしろ以前のバージョンより性能が低下している可能性も指摘されている。
Appleの対応
この問題を受け、Appleは組織改編で対応を図る。Bloombergによると、37年のベテラン社員であるキム・ボラス氏がAIチームに加わり、AI部門トップのジョン・ジアナンドレア氏の下で指揮を執ることになった。
ボラス氏は「バグハンター」として知られ、Appleの重要プロジェクトを成功に導いてきた実績を持つ。直近ではVision Proの開発チームで活躍していたが、Siriの改善を優先課題として異動が決定された。
今後の展開
AppleはSiriの改善に向けて大規模言語モデル(LLM)を活用した新バージョンを開発中だ。新しいSiriはChatGPTのような対話型AIとして生まれ変わる予定で、2025年のWWDCでの発表が有力視されている。
また、iOS 18.3では問題のある通知サマリー機能を一時的に無効化し、iOS 18.4では新機能の追加を予定。さらにiOS 19では、ChatGPTやGoogle Geminiに匹敵する性能を持つLLM版Siriの導入を目指している。
(Source: MacRumors)
もっと読む

Apple Card、発行元をChaseに変更へ。約2年後の移行を正式発表

Appleの2026年新製品発表プラン、全網羅。折畳iPhoneから廉価版MacBookまで、時期別まとめ

Apple Fitness+、1月21日から日本語字幕対応が決定。新年向けワークアウトプログラムも続々追加

Apple初売り2026スタート。オンライン購入OK、楽天ポイント二重取り可。限定AirTagは開始30分が勝負

「まだエントリーしてないの?」Apple初売り、楽天リーベイツで数千円損するよ【今日23時59分まで】

Apple Fitness+、2026年に「Something Big」予告。新年早々発表へ

Appleの初売り2026攻略:還元率20%超えの4製品、購入タイミングとあわせて考える「狙うべき商品」

Appleの初売りを最大化する”裏技”。楽天ポイントの二重取りなどの攻略方法

Appleの初売り、2026年はC smartなど全国32のApple専門店も参戦。だるまがお出迎え

Appleの初売り、2026年も限定AirTagあります。ただしウマではなく…ダルマ

Apple純正マップ、10年続いた機能を静かに廃止。iOS 26で姿を消す

スマホ新法で僕らのiPhoneは何が変わる?App Store以外からアプリDL可能に

スマホ新法で開発者に何が起きる?App Store手数料削減の裏にある”責任”の重さ

トヨタ車でiPhoneが車のキーになる。Apple「Car Keys」対応が間近か

スマホ新法、施行直前。iPhoneユーザーが直面する”安全性の危機”とは

Apple Silicon責任者、一転して残留?「すぐに辞めない」とCook氏の引き留め工作に応じた模様

Apple Fitness+、ついに日本上陸。2026年早々に利用可能、J-Pop対応で過去最大の拡張へ

Apple Silicon生みの親、退任検討か。「別のCEOの下じゃ嫌」と転職希望

Apple次期CEOに”iPod生みの親”が候補に?最有力候補に「準備不足」の声
