Siriのポンコツぶりが露呈。スーパーボウルの基本問題で正答率わずか34%の低水準
Appleは新AI責任者を任命し改善を加速

Appleの音声アシスタント「Siri」に深刻な精度の問題が発覚した。スーパーボウルの歴史に関する基本的な質問で、わずか34%の正答率しか記録できなかったことが明らかになった。
テスト結果の詳細
One Foot Tsunamiのポール・カファシス氏が実施した体系的なテストでは、第1回から第58回までのスーパーボウルの優勝チームをSiriに質問。58回の質問のうち、正答はわずか20問だった。
特に深刻だったのは、フィラデルフィア・イーグルスについての回答だ。実際には1度しか優勝していないチームに対して、33回の優勝歴があると誤って回答。さらに、スーパーボウルXVIIからXXXIIまでの15回連続で誤答を続けるなど、致命的な欠陥を露呈した。
他のAIとの比較で浮き彫りになる問題点
Daring Fireballのジョン・グルーバー氏は、同じ質問をChatGPT、Kagi、DuckDuckGo、Googleに投げかけたところ、いずれも正確な回答を提供できたと報告。Apple Intelligenceを搭載した新しいSiriが、むしろ以前のバージョンより性能が低下している可能性も指摘されている。
Appleの対応
この問題を受け、Appleは組織改編で対応を図る。Bloombergによると、37年のベテラン社員であるキム・ボラス氏がAIチームに加わり、AI部門トップのジョン・ジアナンドレア氏の下で指揮を執ることになった。
ボラス氏は「バグハンター」として知られ、Appleの重要プロジェクトを成功に導いてきた実績を持つ。直近ではVision Proの開発チームで活躍していたが、Siriの改善を優先課題として異動が決定された。
今後の展開
AppleはSiriの改善に向けて大規模言語モデル(LLM)を活用した新バージョンを開発中だ。新しいSiriはChatGPTのような対話型AIとして生まれ変わる予定で、2025年のWWDCでの発表が有力視されている。
また、iOS 18.3では問題のある通知サマリー機能を一時的に無効化し、iOS 18.4では新機能の追加を予定。さらにiOS 19では、ChatGPTやGoogle Geminiに匹敵する性能を持つLLM版Siriの導入を目指している。
(Source: MacRumors)
もっと読む

「高血圧は高齢者のもの」は大間違い。日本の患者4,300万人、3/4が管理不十分で働き盛り世代も危険

AppleとMetaで幹部トレード?デザインはMeta行き、法務はMetaから。屋根にいた環境責任者も退任

Apple Watch、高血圧パターンを自動検出し通知する機能が本日より提供開始

AppleのデザイントップAlan Dye氏、Metaへ電撃移籍。Liquid Glassの顔が退任

AppleのAI部門トップJohn Giannandrea氏が退任。Siri遅延の責任取り新体制へ

iPhone Pocket、全世界で即完売→中国版「激安ニセモノ」にしかない”魅力”

Apple Storeにバッテリーが膨らんだiPhone 3Gを持ち込んだら、神対応だった話

Apple、営業部門で異例の人員削減。数十人規模のレイオフを実施か

Apple、日本に緊急警告。「価格は下がらず利益86%が中国企業等へ」欧州DMAの皮肉な結末

Steve Jobs、「トイ・ストーリー」公開1年後のPixar語る未公開映像が公開

Apple、日本で”Siri不要”の選択を解禁。サイドボタンにAlexaやGemini設定が可能に

Tim Cook、CEO退任後も”居残り”。会長就任で次の10年もAppleを率いる可能性

Tim Cook、来年にもApple CEO退任か。「後継計画を加速」との情報

Tesla買いたい民「CarPlay非対応なら買わない」→ 数カ月以内の展開を目指しテスト中

Apple、米国パスポートから「Digital ID」作成可能に。国内線搭乗に必要な身分証問題を解決へ

Apple Store、返品期間を2026年1月20日まで延長。ホリデーシーズン中のお試し購入がお得に

Apple、EUに激怒。「保護を求めながら保護策を禁止する」矛盾した規制執行を痛烈批判

Apple Fitness+、将来が”見直し”の対象に?組織再編でHealth+と統合か

TSMC、Appleに大幅値上げ通知か。Phone 18搭載チップは現行の6倍、280ドルになる恐れ
