OpenAIとGoogleによる壮大な立ち上げに続き、他の大手ハイテク企業もAI能力を高め、この競争の場で優位に立とうと努力を強めている。
OpenAIはGPT-4oという新しいAIモデルを発表した。 前モデルGPT-4からのアップグレードです。この新モデルは、スピード、テキスト、ビデオ、オーディオの各機能が大幅に向上している。
特筆すべきは、GPT-4oはGPT-4ターボの2倍の速度で、実行コストは半分だ。さらに、新モデルは50の異なる言語に対応し、まだ開発中のビデオチャット機能も利用できる。
Google's I/O 2024カンファレンス は、製品およびサービス全体にAIを統合することで、同社が大きくリードしていることを紹介した。
Geminiに進化したよりスマートなGoogleアシスタントから、GmailのAI搭載機能、Gemini Nanoによるデバイス上での処理強化まで、GoogleはAIが日常のタスクにシームレスに統合される未来を提示した。
現在、アップルは来るワールドワイド・デベロッパーズ・カンファレンス(WWDC)で、人工知能(AI)分野の重大発表を控えている。
同社は、人気の高いChatGPT言語モデルを開発したOpenAIと提携し、AIサービスを強化すると報じられている。
この動きは、特にサムスン電子のようなライバルに対して、アップルのプレミアムスマートフォン市場における競争力を大幅に強化する可能性がある。
アナリストらは、アップルのAI推進には、音声アシスタント「Siri」の刷新に加え、AIを活用した写真・動画処理の進化が含まれると推測している。
こうした技術革新により、ストレージ容量と処理能力が向上したハイエンドのiPhoneへの需要が高まることが予想される。
オープンAIとの提携は、アップルにとって戦略的に重要である。グーグルのAI部門であるジェミニではなく、別の事業体と協力することで、アップルは潜在的な独占禁止法上の懸念を回避できる可能性がある。
iPhoneのデフォルトの検索エンジンとしてのグーグルの支配的な地位は、すでに規制当局からの監視の目を引いており、グーグルのAI技術を統合することは、さらに眉をひそめることになりかねない。
Geminiに進化したよりスマートなGoogleアシスタントから、GmailのAI搭載機能、Gemini Nanoによるデバイス上での処理強化まで、GoogleはAIが日常のタスクにシームレスに統合される未来を提示した。
Visual Look Upのような機能は有望だが、通話管理やアップルのエコシステム内のAI統合の全体的な深さのような分野ではギャップがある。
重要な差別化要因のひとつは、デバイス上での処理である。
Pixelの携帯電話は、AIを搭載したアシスタントを誇り、電話に応答し、文脈を理解し、詐欺電話を検出することさえできる。アップルのライブ・ボイスメールは、ロボットによるトランスクリプト付きだが、それに比べると見劣りする。
Google Workspaceは、電子メールの要約や文脈を考慮した自動返信の生成など、AIの力も強調している。
噂によると、アップルはiWorkスイートに同様の機能を導入する可能性があるようだが、グーグルが現在提供しているものの方が包括的なようだ。
両社ともバーチャル・アシスタントの改良に取り組んでいる。
グーグルのGeminiは複雑なクエリーやタスクの処理を約束し、アップルは大規模な言語モデルを搭載した、より強固なSiriを開発中であろう。
しかし、ジェミニ・ナノのオンデバイス処理能力は、プライバシーとオフライン機能を優先する機能を可能にし、グーグルにとって大きな利点となる可能性がある。
WWDCが近づくにつれ、アップルがAIギャップをどのように埋めるつもりなのかが注目される。
iOS18は、グーグルの通話管理ツールやコアアプリ内のAI搭載機能に対抗する機能を導入するのだろうか?
いくつかの改良が噂されているが、真のテストはこれらの機能の深さとシームレスな統合にある。
今年後半に発表されるiPhone 16では、アップルのAIの野望を補完するハードウェアの進化も明らかになるかもしれない。
WWDCは、よりインテリジェントなユーザー体験のためにAIを活用する競争において、アップルがグーグルとの距離を縮められるかどうかを見極める重要なイベントとなるだろう。
マイクロソフトは、AI技術を直接組み込んだ新しいコンピュータを発表し、AIに大きく力を入れている。
これは、AIのリーダーであろうとする技術大手間の大きな戦いの一部である。マイクロソフトのサティア・ナデラ最高経営責任者(CEO)は、これらの新しいコンピューターによって、AIツールや機能がインターネット接続を介して実行される場合よりも高速に実行されるようになると述べている。
これによりマイクロソフトは、アップル製コンピューターではなくPCを選ぶよう消費者を説得する上で、新たな強みを得ることができるだろう。
マイクロソフトの発表は、グーグルが自社のカンファレンスで何十もの新しいAI機能と製品を披露したちょうど1週間後に行われた。
両社は、AI技術を提供する企業として自らを位置づけようとしのぎを削っている。この戦いは、OpenAIがChatGPTを立ち上げ、業界全体にAIへの突進を開始してから激化している。
この競争の重要な要素のひとつは、新しいAIモデルの開発である。マイクロソフトは、ChatGPTを開発したOpenAIと数十億ドル規模の契約を結び、GPT4oを含むOpenAIの最新AIモデルを新しいコンピューターで利用できるようになった。
これによりマイクロソフトは、独自のAIモデルを開発中のグーグルに対して大きなアドバンテージを持つことになる。
競争のもう一つの要因は、コンピューターに使われているチップの種類である。アップルは自社のコンピューターに独自のカスタムチップを採用し、優れたバッテリー寿命と性能を実現している。
マイクロソフトは現在、AIアプリケーションを高速化するために設計されたクアルコムのチップを使用している。これにより、マイクロソフトは性能面でアップルとの差を縮めることができるだろう。
これは、数十年にわたってPC市場を支配してきたインテル・プロセッサーからの大きな転換である。クアルコムのSnapdragon X Eliteチップにはニューラル・プロセッシング・ユニット(NPU)が搭載されており、マイクロソフトのCopilotソフトウェアなど、AIに特化したアプリケーションを高速化するよう設計されている。
Copilotはマイクロソフトが開発した大規模な言語モデルチャットボットで、電子メールの作成やクリエイティブなテキストフォーマットの生成など、さまざまなタスクに使用できる。
Armベースのプロセッサーへの移行は、バッテリーの寿命とパフォーマンスを向上させ、Armの設計に基づいたカスタムチップを使用しているアップル社のマックコンピューターとより効果的に競争したいという願望が動機となっていると思われる。
マイクロソフトの新しいノートパソコンは、AIを内蔵しているものとして販売され、同社は多くのアプリでこの技術を使うようユーザーに促すだろう。
一方グーグルは、AIが生成した回答を検索結果のトップに載せているが、これは、自分たちのコンテンツが自分たちのウェブサイトから無断で持ち出されていると感じているウェブパブリッシャーを怒らせている。
AIの覇権をめぐるマイクロソフトとグーグルの戦いは始まったばかりだ。この競争の行方は、今後のテクノロジーの利用方法に大きな影響を与えそうだ。
一方中国では、TikTokとDouyinを開発したByteDance社が、中国で最も人気のあるAIチャットボットを開発する競争で百度を抜いた。
ByteDanceが2023年8月に発表したチャットボット「Doubao」は、ダウンロード数でBaiduの「Ernie Bot」を上回り、現在では中国のAppleのiOSで月間アクティブユーザー数を誇っている。これは、バイドゥのAIチャットボット市場における最初のリードに続くものである。
この進展は、バイトダンスがAI分野でのキャッチアップを優先していることを反映している。
Doubaoの成功はこの取り組みを際立たせており、4月までの1年間にアップルのiOSで最もダウンロードされたAIチャットボットとなった。また、Doubaoは月間アクティブユーザー数でも400万人を超え、トップとなっている。
このデータはアップルのiOSプラットフォームのみを対象としていることに注意する必要があるが、中国のAIチャットボット市場におけるより広範な傾向を反映している。
ByteDanceは、DoubaoがモバイルとPCで2600万人の月間アクティブユーザーを抱えていると主張しており、これに対してOpenAIのChatGPTモバイルアプリは米国で670万人の月間ユーザーを抱えている。
中国では、AIチャットボットの覇権をめぐる競争は、バイトダンスとバイドゥの枠をはるかに超えている。
アリババやテンセントといったテック大手は、マイクロソフトのようなグローバル企業とともに、独自のモデルを開発したり、この分野の新興企業に資金を提供するなど、ジェネレーティブAIに多額の投資を行っている。
競争は激しく、ムーンショットAIのような新興企業がKimiボットで市場に参入している。
アナリストは、この「参入障壁の低さ」と「無料サービスの優位性」が、特に高度なAIハードウェアに対する米国の貿易規制を考慮すると、これらすべての企業の収益化の努力を妨げる可能性があると警告している。
イーサリアムの共同創設者であるヴィタリック・ブテリンは、OpenAIのGPT-4言語モデルがチューリング・テストに合格し、重要なマイルストーンを達成したと考えている。
ソースヴィタリック・ブテリンのワープキャスト
チューリング・テストは、1950年にアラン・チューリングによって提唱された理論的なテストである。
ブテリンの結論の根拠は、カリフォルニア大学サンディエゴ校が最近発表したプレプリント論文である。
この研究では、人間はGPT-4に56%の確率で騙されることが判明し、ブテリンは、人間と機械の違いを見分ける能力は、基本的にはコインの裏表のようなものだと述べた。
ソースヴィタリック・ブテリンのワープキャスト
チューリングテストが論争の的となるベンチマークであることに注意することは重要だ。チューリングテストはAIにとって重要な成果であるとする見方がある一方で、必ずしも真の知性を反映していないとする意見もある。
批評家たちは、言葉の背後にある意味を実際に理解することなく、単に人間の会話を模倣することに長けている機械でも、このテストに合格することができると指摘する。
さらに、人工知能(AGI)の概念はしばしばチューリングテストと混同される。
AGIとは、広範な領域で人間レベルの知能を発揮する仮想的なAIのことである。GPT-4は印象的ではあるが、AGIではないと考えられている。
このような制約があるにもかかわらず、ブテリンはGPT-4がチューリングテストで好成績を収めたことは、AIが大きく進歩している証だと考えている。
彼は、このテストが真の知性に相当するものではないことを認めつつも、それでも注目に値する成果であり、AIの進歩を思い起こさせるものだと主張している。
AI技術が進歩を続け、その能力をますます発揮するようになるにつれ、そのセキュリティ面にも同時に対処することが不可欠になっている。
革新と強化の可能性は膨大だが、AIの普及は、誤った情報の拡散や詐欺への感受性など、新たなリスクももたらす。
AIが生成したニュースキャスターは、特に選挙前後に偽情報を広めるために使われている新しいツールである。
こうしたアンカーは、CapCutのようなビデオ編集ツールを使って作成されることが多く、偏ったメッセージを伝え、有権者に混乱を招くために使われることがある。
中国はこのトレンドの最前線におり、AIキャスターを使って親中派のシナリオを推し進め、対立候補を攻撃している。
多くの動画には説得力のないアバターや硬い声が使われているなど、技術は完璧ではないが、AIが生成するコンテンツは今後、より洗練され、信憑性が増すことが懸念される。
専門家は、ディープフェイク(実在の人物を加工した動画)は、完全に合成されたキャスターよりもさらに説得力が増す可能性があると懸念している。
これまでのところ、AIが生成したニュースキャスターの影響は限定的なようだ。マイクロソフトは、このコンテンツが現実世界の出来事に影響を与えた例をあまり見ていないし、蔡英文は偽情報キャンペーンの標的にされたにもかかわらず、台湾の選挙で勝利した。
しかし、こうしたビデオに騙される人もおり、混乱を招く可能性もある。
AIが生成する偽情報の未来は、おそらく既存のツールと新たな開発の組み合わせにある。脅威行為者は、より魅力的なプロパガンダビデオを作成するために、コマーシャルで使用されている技術を適応させるかもしれない。
さらに、強力な新しいAI動画作成ツールのリリースにより、リアルなディープフェイクの作成が容易になる可能性がある。
AIによって生成されたニュースキャスターは、今後の展開が心配されるが、その有効性はまだ不透明である。どのような形であれ、警戒を怠らず、偽情報を特定し、否定する方法を開発することが重要である。
したがって、技術的進歩の追求とともに、強固なセキュリティ対策の開発を優先することが不可欠である。
これには、悪意ある目的でのAIシステムの悪用を防ぐためのセーフガードの導入や、偽情報の流布に対抗するための戦略の考案が必要である。
こうしたセキュリティ上の懸念に積極的に取り組むことで、リスクを軽減し、AIイノベーションが安全かつ責任を持って発展できる環境を醸成することができる。