Siriのポンコツぶりが露呈。スーパーボウルの基本問題で正答率わずか34%の低水準
Appleは新AI責任者を任命し改善を加速

Appleの音声アシスタント「Siri」に深刻な精度の問題が発覚した。スーパーボウルの歴史に関する基本的な質問で、わずか34%の正答率しか記録できなかったことが明らかになった。
テスト結果の詳細
One Foot Tsunamiのポール・カファシス氏が実施した体系的なテストでは、第1回から第58回までのスーパーボウルの優勝チームをSiriに質問。58回の質問のうち、正答はわずか20問だった。
特に深刻だったのは、フィラデルフィア・イーグルスについての回答だ。実際には1度しか優勝していないチームに対して、33回の優勝歴があると誤って回答。さらに、スーパーボウルXVIIからXXXIIまでの15回連続で誤答を続けるなど、致命的な欠陥を露呈した。
他のAIとの比較で浮き彫りになる問題点
Daring Fireballのジョン・グルーバー氏は、同じ質問をChatGPT、Kagi、DuckDuckGo、Googleに投げかけたところ、いずれも正確な回答を提供できたと報告。Apple Intelligenceを搭載した新しいSiriが、むしろ以前のバージョンより性能が低下している可能性も指摘されている。
Appleの対応
この問題を受け、Appleは組織改編で対応を図る。Bloombergによると、37年のベテラン社員であるキム・ボラス氏がAIチームに加わり、AI部門トップのジョン・ジアナンドレア氏の下で指揮を執ることになった。
ボラス氏は「バグハンター」として知られ、Appleの重要プロジェクトを成功に導いてきた実績を持つ。直近ではVision Proの開発チームで活躍していたが、Siriの改善を優先課題として異動が決定された。
今後の展開
AppleはSiriの改善に向けて大規模言語モデル(LLM)を活用した新バージョンを開発中だ。新しいSiriはChatGPTのような対話型AIとして生まれ変わる予定で、2025年のWWDCでの発表が有力視されている。
また、iOS 18.3では問題のある通知サマリー機能を一時的に無効化し、iOS 18.4では新機能の追加を予定。さらにiOS 19では、ChatGPTやGoogle Geminiに匹敵する性能を持つLLM版Siriの導入を目指している。
(Source: MacRumors)
もっと読む

Apple純正マップ、10年続いた機能を静かに廃止。iOS 26で姿を消す

スマホ新法で僕らのiPhoneは何が変わる?App Store以外からアプリDL可能に

スマホ新法で開発者に何が起きる?App Store手数料削減の裏にある”責任”の重さ

トヨタ車でiPhoneが車のキーになる。Apple「Car Keys」対応が間近か

スマホ新法、施行直前。iPhoneユーザーが直面する”安全性の危機”とは

Apple Silicon責任者、一転して残留?「すぐに辞めない」とCook氏の引き留め工作に応じた模様

Apple Fitness+、ついに日本上陸。2026年早々に利用可能、J-Pop対応で過去最大の拡張へ

Apple Silicon生みの親、退任検討か。「別のCEOの下じゃ嫌」と転職希望

Apple次期CEOに”iPod生みの親”が候補に?最有力候補に「準備不足」の声

「高血圧は高齢者のもの」は大間違い。日本の患者4,300万人、3/4が管理不十分で働き盛り世代も危険

AppleとMetaで幹部トレード?デザインはMeta行き、法務はMetaから。屋根にいた環境責任者も退任

Apple Watch、高血圧パターンを自動検出し通知する機能が本日より提供開始

AppleのデザイントップAlan Dye氏、Metaへ電撃移籍。Liquid Glassの顔が退任

AppleのAI部門トップJohn Giannandrea氏が退任。Siri遅延の責任取り新体制へ

iPhone Pocket、全世界で即完売→中国版「激安ニセモノ」にしかない”魅力”

Apple Storeにバッテリーが膨らんだiPhone 3Gを持ち込んだら、神対応だった話

Apple、営業部門で異例の人員削減。数十人規模のレイオフを実施か

Apple、日本に緊急警告。「価格は下がらず利益86%が中国企業等へ」欧州DMAの皮肉な結末

Steve Jobs、「トイ・ストーリー」公開1年後のPixar語る未公開映像が公開
