OpenAI、マルチモーダルの音声AIアシスタントを発表か
電話機能の中にChatGPT機能を組み込む準備を進めていることを示唆する記述が発見
OpenAIが、マルチモーダルの音声AIアシスタントを発表する可能性がある。The Informationによるとすでに一部の顧客に対して披露しており、従来と比べて画像や音声をより速く、正確に認識できるという。
マルチモーダルとは、テキスト・画像・音声・動画など様々なデータをまとめて処理できるAI技術。OpenAIの新しいモデルは、カスタマーサービスにおいて顧客が皮肉を込めた発言をしているか見分けられ、現実世界のサイン読み取りや学生の数学問題サポートなども「理論上は可能」だと報じている。
一部情報によると、電話機能の中にChatGPT機能を組み込む準備を進めていることを示唆する記述が発見されている。
OpenAI seems to be working on having phone calls inside of chatGPT. This is probably going to be a small part of the event announced on Monday.
(1/n) pic.twitter.com/KT8Hb54DwA— Ananay (@ananayarora) May 11, 2024
OpenAIは日本時間5月14日午前2時より、オンラインで発表イベント「Spring Updates」の開催を予告している。
We’ll be streaming live on https://t.co/OcO6MLUYGH at 10AM PT Monday, May 13 to demo some ChatGPT and GPT-4 updates.
— OpenAI (@OpenAI) May 10, 2024
(Source: The Information via The Verge)