圧倒的トップのOpenAIが減速

JinseFinance

2024/05/14 18:10

従う

「もしリリースがGPT-5なら、OpenAIはまだずっと先だ。

「もしリリースがGPT-5なら、OpenAIはまだずっと先です。

あるAIビッグモデルの実践者は、業界のOpenAIへの期待が高すぎるため、GPT-5のような破壊的イノベーションでない限り、視聴者の「食欲」を満たすことは難しいとTiger Senseに語っています。

サム・アルトマンは、GPT-5（またはGPT-4.5）がOpenAIの生放送の前にリリースされることはないだろうと予測していましたが、OpenAIに対する外部の期待は以前から高すぎるのです。

北京時間5月14日未明、OpenAIは最新のGPT-4oを発表しました。20分以上のデモ放送は、現在のすべての音声アシスタントを遥かに凌駕するAI対話体験を実演し、基本的に海外メディアが以前に明らかにしたニュースと重なりました。

GPT-4oのデモは依然として「クラッカー」であったものの、アルトマンのティーザーにあった「マジック」には到底値しないと広く見られていた。アルトマンのティーザーには「マジック」という言葉が使われていた。これらの機能的な製品は、「OpenAIのミッションからの逸脱」だと多くの人が考えている。

OpenAIの広報チームは、このような意見の方向性を予測していたようです。

「私たちのミッションの重要な部分は、信じられないほどパワフルなAIツールを無料で（または割引価格で）人々に提供することです。私たちは、世界最高のモデルを、広告も何もない ChatGPT で無料で利用できるようにしていることを、とても誇りに思っています。

私たちが OpenAI を始めたとき、私たちの当初の考えは、AIを作り、それを使って世の中にあらゆる利益を生み出すというものでした。そうではなく、今は、私たちがAIを作り、他の人たちがそれを使って、私たち全員に利益をもたらすあらゆる種類の素晴らしいものを作ろうとしているように見えます」。

「"すべての "返信を5秒待たなければならないのであれば、ユーザーエクスペリエンスは崩壊してしまいます。合成された音声自体が本物のように聞こえたとしても、没入感を壊し、生気がないように感じさせてしまいます。"

OpenAIのローンチ前夜、NVIDIAのEmbodied AI部門の責任者であるJim Fan氏は、OpenAIがXでリリースする音声アシスタントを予測し、次のように示唆しました:

。

ほとんどすべての音声AIは3つの段階を経ています。

1.音声認識または「ASR」：音声-テキスト1、例えばWhisper;

2. 次に何を言うか計画する;LLM: text1 -> text2;

3. 音声合成または「TTS

ElevenLabsやVALL-Eなどの音声合成。

GPT-4oは以下の点で優れています。応答速度、レイテンシーの問題をほぼ解決。GPT-4oは最小232ミリ秒、平均320ミリ秒の応答時間でオーディオ入力に応答し、人間とほぼ同じです。GPT-4oなしのChatGPT音声対話機能の平均待ち時間は、2.8秒 (GPT-3.5) と5.4秒(GPT-4)でした。

GPT-4oは、待ち時間を短縮することでエクスペリエンスを劇的に向上させるだけでなく、GPT-4をベースとして、次のような多くのアップグレードを行います。text-align: left;">音声、ビデオ、および画面共有を含む、優れたマルチモーダル対話機能。

人間の表情、テキスト、数式をリアルタイムで認識し、理解します。

インタラクティブな音声は感情豊かで、声のトーンやスタイルを変えたり、モノマネをしたり、歌を「即興」で歌うこともできます。

超低遅延で、会話の途中でAIをリアルタイムで中断し、情報を追加したり、新しいトピックを始めることができます。

ChatGPTの全ユーザーは無料で利用できます（利用上限あり）。

GPT-4ターボの2倍速く、APIコストは50%低く、レート制限は5倍です。

⇦

"これらの制限のブレークスルーはイノベーションです。"

業界の専門家たちは、GPT-4oのマルチモーダル機能は「よく見える」だけであり、OpenAIは実際には視覚的マルチモーダリティの「ブレークスルー」と考えられるものを実証していないと主張しています。視覚的マルチモダリティの「ブレークスルー」。

大モデル業界ではお決まりのように、Claude 3と、すぐ隣にあるAnthropicのClaude 3を比較してみましょう。

Claude 3の技術資料には、「Claudeの画像理解能力は優れているが、できるほどではない。クロードの画像理解能力は最先端であるが、注意すべきいくつかの制限がある。"

これには次のようなものがあります：

人物認識：クロードは画像の中の人物を認識する（つまり名前をつける）ために使うことはできません。また、それを拒否します。
精度：クロードは低画質、回転、200ピクセル以下の非常に小さな画像を解釈する際に幻覚を見たり、間違いを犯すことがあります。
空間的推理：クロードの空間的推理は限られている。アナログ時計の文字盤を読んだり、チェスの駒の正確な位置を説明したりするような、正確な位置や配置を必要とする作業は難しいかもしれません。
数え上げ：クロードは画像内の物体のおおよその数を数えることができるが、特に小さな物体の数が多い場合、必ずしも正確ではないかもしれない。
AIが生成した画像：クロードは画像がAIが生成したものかどうかわかりません。捏造画像や合成画像の検出には当てにしないでください。
不適切なコンテンツ：クロードは私たちの利用規定に違反する不適切な画像や露骨な画像を処理しません。
ヘルスケアへの応用：Claude は一般的な医療画像を分析できますが、CT や MRI のような複雑な診断スキャンを解釈するようには設計されていません。
‍

GPT-4oのウェブサイトに掲載されている症例には、「空間推理」に関連する能力を持つものが多数あります。

GPT-4oのウェブサイトに掲載されている症例の中には、「空間推理」に関連する能力を持つものが多数あります。

さらに、発表会でのライブデモにおけるGPT-4oの出力から、そのモデリング能力がGPT-4からそれほどかけ離れていないことが容易にわかる。

GPT-4oのランタイムスコア

このモデルは台詞にトーンを加え、即興で話すこともできるが、台詞はGPT-4と同様にディテールと創造性に欠けている。
さらに、GPT-4oの一連のユースケースは、会議後にOpenAIのウェブサイトで公開されました。これらには、写真からコミックへのスタイル、会議議事録、画像合成、画像ベースの3Dコンテンツ生成、手書きと草稿の生成、スタイル化されたポスターとコミックストリップの生成、アートフォントの生成などが含まれます。
また、これらの機能のうち、写真からコミックスタイル、会議議事録などは、テキストから生成するダイアグラムやAIビッグモデル機能としても一般的です。
"ChatGPTプラスのサブスクリプションに毎月20ドル支払う必要がないように、5つの無料ChatGPTアカウントにサインアップしますか？"
OpenAIが発表したGPT-4oの利用ポリシーでは、ChatGPT Plusの加入者は、一般ユーザーに対する制限よりも5倍高いトラフィック制限が適用されます。
GPT-4oは誰でも無料で利用できるものであり、まず最初に挑戦されるのはOpenAI自身のビジネスモデルのようです。
サードパーティの市場分析プラットフォームであるSensor Towerが発表したデータによると、過去1ヶ月間で、ChatGPTは世界のApp Storeで700万ダウンロード、1200万ドルのサブスクリプション収入があり、世界のGoogle Playマーケットプレイスでは9000万ダウンロードがあった。百万ダウンロード、300万ドルのサブスクリプション収入がありました。
現在、ChatGPT Plusは両アプリショップで19.99ドルで入手可能です。サブスクリプションのデータから推測すると、ChatGPT Plusは過去1ヶ月でアプリショップを通じて75万人の有料サブスクライバーを獲得しています。ChatGPT Plusにはまだ多くの直接有料会員がいるが、モバイルからの収益という点では、年間2億ドル弱で推移しており、OpenAIの1000億ドル近い評価額を数倍にすることで支えるのは難しい。
これを見ると、OpenAIは個々のユーザーへの課金について深く考える必要はありません。
さらに、GPT-4oは良いエクスペリエンスに重点を置いているため、AIとチャットしているときに切れてしまい、再びチャットするためにアカウントを変更しなければならなくなった場合、トップアップすることに憤慨するでしょうか？
「オリジナルの ChatGPT は言語インターフェースの可能性を示唆していました。速くて、スマートで、楽しくて、自然で、役に立つ。"
サム・アルトマンの最新のブログでは、「言語インターフェースの可能性」について言及しています。すべてのGUI（グラフィカル・インタラクション・インターフェイス）に挑戦し、LUIの限界を押し広げようとする人たちです。
最近のOpenAIとAppleのコラボレーションのニュースと合わせて、GPT-4oは近いうちに、AI PCやAI携帯電話のすべてのメーカーに「オリーブの枝を投げる」、あるいは「テーブルを持ち上げる」ことになるだろうと推測できます。「テーブルを持ち上げる」。
どのような音声アシスタントやAIビッグモデルであっても、AIPC、AI携帯電話のコアバリューはエクスペリエンスを最適化することであり、GPT-4oは一気にエクスペリエンスを極限まで最適化した。
GPT-4oは、SaaS業界でさえ、すべての既知のアプリに展開する可能性がある。過去1年ほどの間に市場で開発され、開発中のすべてのAIエージェントが危険にさらされることになります。
あるリソースアグリゲーションアプリのプロダクトマネージャーがタイガーセンスに言ったことがある。"私の操作プロセスはプロダクトのコアであり、もし操作プロセスがあなた方ChatGPTによって最適化されるなら、私のアプリには価値がないに等しい。"と。
もしあなたがテイクアウトアプリを注文した場合、UIは "私に食べ物を注文する "という文章になり、米国グループを開いたり、空腹を開いたり、ユーザーにとっては同じであることを想像してみてください。
メーカーの次のステップは、サプライチェーンの圧縮、生態学的な利益率、さらには悪質な価格競争にすることができます。
現在の形からすると、他のベンダーがモデル能力の面でOpenAIを打ち負かすには、しばらく時間がかかると思います。
製品がOpenAIに匹敵する唯一の方法は、より安いモデルを作ることです。
"最近忙しすぎて、彼らに目を向ける余裕がない。"
大規模な産業用AIモデルの創設者の1人は、戦略的パートナーシップ、製品リリース、顧客交換や資本交換に関するコミュニケーションで最近忙しく、OpenAIのようなリリースに注意を払う時間がまったくなかったとTigerSenseに語っています。
OpenAIのリリースに先立ち、タイガーセンスは国内の各界のAI実務家にも聞いてみたが、OpenAIの最新リリースに対する彼らの予想や見解は、異口同音に「非常に楽しみだが、自分とは関係ない。
ある開業医は、現在の国の進歩から見て、短期間でOpenAIに追いつくのは現実的ではないと言いました。そのため、OpenAIのリリース内容を気にするのであれば、最新技術の方向性を見るのが精一杯だという。
現在、国内企業はAIモデル開発において、より現実的で実現しやすいエンジニアリングモデルやバーティカルモデルを重視するのが一般的だ。
エンジニアリングでは、最近台頭してきたディープシークが、国内のビッグモデル業界で東建の価格競争を巻き起こしている。垂直モデルの面では、短期的には、小型モデルと垂直モデルの開発は基本的にOpenAIの人質にはならないと、多くの業界関係者がTiger Senseに語った。
"OpenAIの技術的な方向性はあまり価値がないこともある"。
Soraが登場する前、ヴァンセンヌ映像の分野では多くの国内企業や組織が15秒の安定した映像生成を達成しており、Soraが登場した後、企業の研究開発、資金調達、製品リズムの一部が破壊され、さらにはヴァンセンヌ映像業界全体の発展を「技術の飛躍」に進化させた。
幸いなことに、今回のGPT-4oは空とは大きく異なっており、OpenAI CTOのMuri Murati は、「今後数週間にわたり、反復的な展開を続け、すべての機能を提供する予定です。
発表後すぐに。GPT-4oはオンライン試用が可能でした。

Preview

に関するその他のニュース chatgpt 속도 느림

6月 11, 2024 9:07 午前
イーロン・マスク：アップルのデバイスOSがChatGPTと統合されれば、ChatGPTは会社から追放されるだろう
イーロン・マスクはXプラットフォームへの投稿で、iPhone、iPad、MacコンピュータにOpenAIのChatGPTを統合した場合、アップルのデバイスを会社から追放すると述べた。これは容認できないセキュリティ違反だ" マスク氏は、テスラやスペース・エクスプロレーション・テクノロジーズ・コーポレイション（Space Exploration Technologies Corp）など、同氏が経営する企業への訪問者は、入館時にアップルのデバイスを「ファラデーケージに」保管する必要があるとまで示唆した。(コインテレグラフ)
5月 30, 2024 4:45 午後
XRPの伸びは鈍化するも、強気のペースを維持
U.Todayによると、XRPは柴犬（SHIB）などの他のアルトコインと比較して、過去24時間の成長率が鈍化している。現在、XRPは0.5299ドルで取引されており、0.6％減少しています。一方、暗号通貨全体の時価総額は1.2％増加し、2兆5600億ドルとなっています。にもかかわらず、Cryptorankのデータによると、XRPは今月5.72％の成長を達成した。このペースで続けば、XRPは9.84%上昇した2023年5月のパフォーマンスと同様に、強気で今月を終えることが予想される。 XRPの過去のデータは、デジタル通貨が2014年以来5月にほとんどの損失を記録し、複雑な感情を示しています。2020年5月、2021年5月、2022年5月にそれぞれ4.4%、34.4%、28.4%の下落を経験した後、XRPは2023年5月に9.84%の上昇で弱気の連鎖を断ち切りました。この反発は持続しており、XRPの取引量はスポットとデリバティブの両方のトレーダーからの強気なセンチメントを示している。しかし、XRPの来月の見通しには懸念がある。Cryptorankのヒストリカルデータによると、6月は2018年以降、コインにとって最も弱気な月の一つであり、XRPがこのネガティブなトレンドをどのように克服するかについて疑問が投げかけられている。これに影響を与える可能性のある重要な要因は、リップルラボと米国SECとの間の訴訟和解の可能性です。両者は現在、裁判所の判断を待っている。さらに、XRP Ledgerのエコシステムの発展も、6月のXRPにとって極めて重要な反発に寄与する可能性があります。
5月 29, 2024 8:25 午後
SEC元幹部、急速に進化する市場規制における同庁の遅いペースを批判
Odailyによると、米証券取引委員会（SEC）の元幹部マーク・フェーゲル氏は、急速に発展する市場の規制ペースが遅いと同委員会を批判した。同氏は議会が介入し、暗号通貨業界を規制することを望むと表明した。フェーゲル氏は、SECは急速に発展する新分野を無視する癖があると述べた。違反記録のない未登録企業に対するSECの調査に関連して、フェーゲル氏は、登録は情報開示を容易にするための要件であると説明した。企業が違反を犯すのを待ってから対策を講じるのは、SECを常に追いつめる受動的なアプローチだと主張した。
5月 24, 2024 3:47 午後
알고랜드, BTC·ETH·SOL 저격 광고..."느리고 비싸"
코인텔레그래프에 따르면 레이어1 블록체인 알고랜드(ALGO)가 비트코인, 이더리움(ETH), 솔라나(SOL)를 저격한 광고를 공개했다. 알고랜드 재단이 23일 유튜브를 통해 게시한 영상 광고에는 한 남성이 등장한다. 이 남성은 마트에서 암호화폐로 결제를 시도하는데 △비트코인 결제시 27분 소요 △이더리움 결제시 수수료 112달러 △솔라나 결제시 체인 중단으로 결제 실패 등을 겪는다. 이후 영상에서는 "ALGO는 낮은 수수료, 속도감 있는 라이프 스타일을 제공한다"는 문구가 흘러나온다. 이 광고와 관련해 커뮤니티에서는 "알고랜드는 익스플로러도 제대로 운영하지 못하면서 광고비로 10만 달러 이상을 지출했다"는 비판이 나오고 있다고 미디어는 설명했다. 디파이라마 기준 알고랜드의 총 락업 예치금(TVL)은 9,600만 달러 수준으로 이더리움(650억 달러), 솔라나(48억 달러)에 크게 못 미친다.
5月 06, 2024 7:47 午後
Matrixport：新しいUSDTコインの提供は少し遅れる
MatrixportはXプラットフォームへの投稿で、最近の市場の焦点はビットコインETFのフローであるが、ステーブルコインの流入は過去2ヶ月のビットコイン価格の統合の間にも増加し続けており、暗号通貨の普及率がまだ急速に伸びていることを示唆していると述べた。USDTの新規コイン発行ペースは最近鈍化しており、これが加速すればビットコインに好影響を与える可能性がある。
4月 20, 2024 12:03 午後
スローミスト・コサイン：碑文はルーンのテストベッドになる
スローミストの創設者ユーシンはX Platformへの投稿で、「インスクリプションはルーンの実験場のようなもので、インスクリプションの様々な大容量ファイルと大量の『無意味な』BRC-20保持情報が、CVEの脆弱性によってナンバリングされたビットコインのTaprootデータに現れ、騒動を引き起こした。しかし、碑文は話題に暴力的な美学をもたらす。一方、RuneはUTXOモデルに基づいており、データはOP_RETURN（スペースは非常に限られている）に保存され、よりミニマルでコンパクトだが、スペースが限られているため、それ自体でできることは限られており、流通のためのコイン発行に主眼を置いているのではないかと思う。つまり、碑文はルーンのテストベッドのようなもので、「ようなもの」とは主にBRC-20を意味する。私が目にするルーンは、少なくとも現状では、BRC-20の「ウォンキー」な碑文形式に対処するためにここにある。熱狂や論争がどうなろうと関係ない。少なくともビットコインネットワークを促進するためには良いことだし、そうでなくても時間が選択肢を与えてくれる。"
4月 06, 2024 7:29 午後
柴犬の未来は暗いようです：遅いネットワーク活動の原因
柴犬(SHIB)の価格は、さまざまな市場指標を探りながら、微妙な動きを見せています。一方で、特定の指標は活動の安定化を示唆しており、投資家の間で慎重な楽観主義を示唆しています。一方で、新たな技術的パターンと変動する投資家の関心は、今後のボラティリティが上昇する可能性を示唆しています。シヴァネットワークの活動が鈍化過去1ヶ月間のShibaの平均取引規模を分析すると、急成長した後、安定化していることがわかります。当初、平均取引規模は2週間で81.23%減少するなど、大幅に減少しました。しかし、この減少の後、取引規模は安定化し始め、Shibaの価格がより安定した段階に移行していることを示しています。柴犬の取引規模。出典：... source: https://kr.beincrypto.com/base-news/52866/
12月 08, 2023 9:39 午後
FCAは暗号取締りに遅すぎると英国の支出監視委員会が指摘
英国の金融行動監視機構（FCA）は、暗号法の施行が遅すぎると国家監査院から批判されている。ソース：https://protos.com/fca-too-slow-on-crypto-enforcement-says-uks-spending-watchdog/
11月 28, 2023 7:53 午後
イーサリアムのERC-4337スマートウォレットの普及と定着の遅れ
Blockworksによると、今年初めにイーサリアム財団のERC-4337アカウント抽象化標準が導入されたものの、その普及率と定着率は低調であったという。この標準は、イーサリアムのアカウントをスマートアカウントに変換し、ウォレットホルダーに柔軟性を提供するために設計されました。しかし、BundleBearのデータによると、ERC-4337スマートウォレットの週間リテンションは5週間以上前のアカウントでは1％と低く、平均的なスマートアカウントは5回のユーザー操作しか送信していない。トランザクション・バンドラーの収益も低く、現在週当たり8,000ドル以下である。sixdegreeのデータによると、本稿執筆時点では、デイリーアクティブユーザーは約3％である。ほとんどのスマートアカウントユーザーはポリゴンネットワークを利用しており、全スマートアカウント保有者の66％以上を占め、チェーン別の月間新規ユーザーのほとんどを占めている。イーサリアムでの普及率が低いにもかかわらず、業界関係者はスマートアカウントの将来について楽観的であり、利用を促進するための提案に積極的に取り組んでいる。アカウントの抽象化インフラ企業であるStackupの共同創業者であるジョン・ライジング氏は、ERC-4337の既存の問題の多くは、史上初のロールアップ改善提案であるRIP-7560で解決できると考えています。既存のERC-4337標準はセミネイティブ＋スマートアカウントと考えられており、トラストレスリレーネットワークがトランザクションをブロックチェーンに転送するように設計されているため、ユーザーは秘密鍵を必要としない。ライジングは、アカウントが独自の検証ロジックを指定できるようになり、秘密鍵の必要性が完全になくなるネイティブ・スマート・アカウントへの移行を目指しており、RIP-7560はその実現を目指している。「ERC-4337は常に、ネイティブなアカウント抽象化への足がかりとなることを意図しています。アカウント抽象化の提案であるRIP-7560は、ERC-4337と後方互換性を持つように設計されています。この提案とその適用可能性をめぐるさらなる議論は、まだ検討されなければなりません」とライジング氏はBlockworksに語っている。ネイティブ・アカウント抽象化は、高レベルのインフラ層の変更ではなく、コンセンサス層の変更を導入するため、複雑さが増すという懸念がある。
11月 28, 2023 1:17 午前
FRBが望ましいとするインフレ率の指標は緩やかに後退し、金利は長期的に高く維持される
ヤフー・ニュースによると、ブルームバーグがエコノミストを対象に行った最新の調査では、米連邦準備制度理事会（FRB）が好んで使用する基本的なインフレ指標であるコア個人消費支出（PCE）指数の低下ペースは緩やかになり、その結果、金利は長期的に上昇すると予想されている。個人消費支出（PCE）指数は、変動の激しい食品とエネルギーのカテゴリーを除いたもので、来年末までの年間コア指数を予測した。PCE指数は2024年末までに2.5％となり、前月の2.4％から上昇すると予測されている。一方、PCE総合指数と代替消費者物価指数は、主にエネルギー価格の後退により、2024年半ばまで従来の予想より早く後退すると予想される。最近の報道は物価上昇圧力緩和の兆しを示しているが、FRB高官はインフレの勝利を宣言する前に、持続的な冷え込みの兆候が必要であることを強調している。政策立案者は、コア指数が物価上昇圧力のより良い指標であると考えている。エコノミストたちは、FRBが来年第2四半期に金融緩和を開始すると予想しているが、現在では2025年末まで高金利を維持すると予測している。ネーションワイド・ライフ・インシュアランスのチーフ・エコノミスト、キャシー・ボストヤンチッチ氏は、インフレ、雇用の伸び、個人消費の最近の鈍化は、FRBがこのサイクルで利上げを終了したとの考えを支持していると述べた。しかし彼女は、FRBは2024年半ばまで利下げを待ち、政策緩和は緩やかになるだろうと付け加えた。予測担当者は、今期の景気拡大ペースは年率1.2％で、前回調査の0.7％から上昇すると予想している。短期的には個人消費と政府支出の拡大が景気を下支えすると予想されるが、エコノミストは現在、民間投資の大幅な減速が2025年初頭までの成長を鈍化させると予想している。雇用市場はおおむね好調を維持しているが、労働者に対する需要は徐々に軟化し始めている。失業率は4.4%でピークを迎えるとエコノミストは予想しているが、失業率の低下にはさらに時間がかかると見ている。また、2025年まで米国の平均雇用者数は減少すると予測している。