カープラスキーは大規模言語モデル向けのHTML出力を推奨し、究極の形としてインタラクティブなニューラルビデオを予測する

アンドレイ・カラパシーによれば、OpenAIの創設メンバーであり「vibe coding(雰囲気でコーディング)」の概念を生み出した人物である彼は、今日、Claude Codeチームが大規模言語モデルの出力にMarkdownではなくHTMLを使うというアプローチを支持した。カラパシーは、AI対話インターフェースの進化ロードマップを次のように示した。プレーンテキストからMarkdownへ、そしてHTMLへ、さらに複数の中間形態を経て、最終的には拡散モデルによって直接生成されるインタラクティブなニューラルビデオの段階に到達する。

カラパシーは、この進化を人間の脳の帯域幅(バンド幅)に起因するとし、人間の脳の約3分の1が視覚信号を並列に処理していると述べた。情報入力のための「10車線ハイウェイ」だという。彼は、人間とAIの最適なインタラクションは、人間の入力には効率の良い音声を、AIからの出力には高帯域幅の視覚情報(画像、アニメーション、または動画)を組み合わせることだと主張した。彼は、ユーザーが短期的な改善としてプロンプトに「HTMLとして構造化された返信を追加する」ことをすぐに行うよう勧めた。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

百億新創 Thinking Machines が発表した即時インタラクティブな AI モデルは、「話しながら聴いて、作業しながら進める」を売りにしています

前 OpenAI の前幹部である Mira Murati と John Schulman によって共同創業され、評価額が100億ドルにのぼる人工知能スタートアップの Thinking Machines は、火曜日に、話しながら聞く(「邊說邊聽」)ことを可能にした最初の全二重(フルデュプレックス)AIモデルのプレビュー版を発表し、遅延は0.4秒まで低減、既存の人機のリアルタイム・インタラクション方式に挑戦する。 (NVIDIA が出資する Thinking Machines Lab は Vera Rubin を導入し、最先端モデルの性能を引き上げる) Thinking Machines の新モデル:交互に話す“旧来の”方式を打ち破る 既存の主流すべての AI モデルは、その動作方式が「ユーザーが入力すると、モデルが待ち、そして応答する」です。前 OpenAI の技術責任者である Mira Murati と OpenAI の共同創業者 John Schulman は、このような交互の返信プロセスは、メッセージのやり取りに似ていて、真の対話ではないと考えています。いま、二人が共同で立ち上げた

ChainNewsAbmedia24分前

攻撃者がTanStack、OpenSearch、Mistralの公式パイプラインを乗っ取り、5月12日に84の悪意あるバージョンを投入

Beatingのモニタリングによると、5月12日3:20〜3:26(UTC+8)に、TeamPCPに関連する攻撃者がTanStack、AmazonのOpenSearch、Mistralの公式リリースパイプラインを乗っ取り、npmとPyPIで84件の不正なパッケージ版を投入しました。影響を受けたパッケージには、@tanstack/react-router(週次ダウンロード10M+)、@opensearch-project/opensearch(週次ダウンロード1.3M)、およびMistralのmistralaiクライアントが含まれます。不正パッケージは、GitHub Actionsの設定上の欠陥を悪用して正規の一時的なパブリッシング認証情報を入手し、SLSAビルドのプロベナンス署名を取得できるようにすることで、セキュリティの信頼メカニズムを回避しました。 Socket.devの逆解析では、パッケージ削除後も、Claude Codeの実行フック(.claude/settings.json)およびVS Codeのタスク設定(.vscode/tasks.json)にコードを注入することでワーム

GateNews42分前

Ixirpad は Cware Labs と提携し、AI および Web3 のスタートアップを支援します

5月11日の発表によると、IxirpadはWeb3業界における持続可能なインフラ開発を加速するため、Cware Labsと戦略的パートナーシップを締結しました。ベンチャースタジオとして運営されるCware Labsは、高い可能性を持つブロックチェーンおよびAIプロジェクトを特定し、支援します。今回の連携は、運用上の助言、戦略的支援、開発リソースへのアクセスを提供することで、成長途上の企業が初期段階のコンセプトから投資可能でスケーラブルな事業へ移行できるようにすることを目的としています。さらにCware Labsは、Ixirpadエコシステムに統合されるプロジェクトについて、トークノミクス、コンプライアンス、そして長期的な収益の持続可能性に重点を置いてデューデリジェンスも実施します。

GateNews56分前

Claude Code エージェント表示:単一画面での並行セッション管理

Anthropic は 5 月 11 日、Claude Code に新機能「Agent View」を導入し、同時に複数の Claude Code ワークセッションを一つの画面で管理できるようにすることで、複数のターミナルの分割タブを行き来して切り替える必要がなくなった。Anthropic 公式ブログによると、この機能は Research Preview 形式で提供され、Pro、Max、Team、Enterprise、そして Claude API の各プランに対応する。公式 X アカウントが投稿した単発のツイートは 1.8 万回以上の「いいね」を獲得しており、同アカウントの直近で最も話題の大きいプロダクト更新となっている。 Agent View インターフェース:すべての session を一覧で管理 Agent View は集中型ダッシュボードを提供し、稼働中のすべての Claude Code session を一覧表示する。各行には 4 つの情報が表示される。session 識別子、ユーザー入力待ちかどうか、直近のモデル応答内容のプレビュー、最後のやり取りのタイムスタンプ。 操作方法

ChainNewsAbmedia1時間前

オーストラリアがアンチマネーロンダリング規則を7月1日に拡大する中、オーストラクはAI主導のマネーロンダリングのリスクに警告

オーストラリアの金融情報機関であるAUSTRACによると、5月12日にオーストラリアの金融情報機関は、人工知能が犯罪者による身元の捏造、書類の偽造、そして収益の隠匿をより速く、より大規模に可能にすることで、マネーロンダリングのリスクを高めていると警告した。 2026年7月1日から、不動産仲介業者、貴金属および宝石類のディーラー、ならびに信託および会社サービス提供者は、オーストラリアのマネーロンダリング対策およびテロ資金供与対策の規則の対象となり、AUSTRACは、多くの事業者が悪用されるリスクが高い、または非常に高いと指摘している。

GateNews1時間前

Google:大規模言語モデルが実際の攻撃に悪用され、AIは二要素認証のセキュリティ機構を回避できる可能性があります

CoinEdition が 5 月 12 日に報じたところによると、Google の脅威インテリジェンス チームが警告を発表し、攻撃者が世界規模のシステムに影響を及ぼす実際のネットワーク攻撃で、大規模言語モデルを使用していたことが明らかになった。さらに、ハッカーが Python ベースのゼロデイ脆弱性を開発し、二要素認証(2FA)の安全メカニズムを回避できることも確認された。Google は、こうした活動が、国家規模のサイバー攻撃や地下のハッカー ネットワークにおける AI ツールの悪用と関連していると述べている。 AI ツールはネットワーク攻撃で具体的にどう使われているのか Google の脅威インテリジェンス チームの報告によると、AI ツールは、より迅速なソフトウェア脆弱性の発見、自動化できる攻撃手順の一部、フィッシング(Phishing)やマルウェア作成といった攻撃手法の改善など、ネットワーク攻撃のほぼあらゆる段階で攻撃者の能力を高めるのに役立っている。 報告には、具体的な事例も記録されている。ハッカーが Python ベースのゼロデイ脆弱性を利用して二要素認証(2FA)を正常

MarketWhisper1時間前
コメント
0/400
コメントなし