- 家
- コンピューティング ニュース

AIスタートアップ企業Anthropicは、Claude 3.5 Sonnet大規模言語モデルがGPT-4oやLlama-400Bなどの他の主要モデルに勝利したという発表に続き、月曜日に、同社の次期モデルを評価するための独立したサードパーティのベンチマークテストの開発に資金を提供する新しいプログラムを開始する予定であると発表した。
ブログ投稿によると、同社は「AIモデルの高度な機能を効果的に測定」できるベンチマークを作成するためにサードパーティの開発者に報酬を支払う用意があるという。
「これらの評価への投資は、AIの安全性という分野全体の向上を目指し、エコシステム全体に利益をもたらす貴重なツールを提供することを目的としています」と、アンスロピックは月曜日のブログ投稿で述べています。「高品質で安全性に配慮した評価の開発は依然として困難であり、需要が供給を上回っています。」
同社は、AIの相対的な「安全レベル」を、サイバーセキュリティ、化学・生物・放射線・核(CBRN)、そして不一致、社会操作、その他の国家安全保障リスクを含む、様々な要因に基づいて測定するためのベンチマークを提出したいと考えています。また、モデルの高度な機能を評価するためのベンチマークも求めており、「大学院生でさえ挑戦できるような、数万もの新しい評価質問とエンドツーエンドのタスクの開発」にも資金提供を予定しています。これは、様々な情報源から知識を統合するモデルの能力、巧妙に表現された悪意のあるユーザーからのリクエストを拒否する能力、そして複数の言語で応答する能力をテストするものです。
アントロピックは、「十分に困難」で、多様なテスト形式において最大「数千」のテスターが関与する、大量のタスクを募集しています。これらのタスクは、同社の「現実的かつ安全性に配慮した」脅威モデリングの取り組みに役立てられます。ご興味のある開発者は、ぜひ同社に提案をご提出ください。同社は随時、提案内容を評価する予定です。
アンドリュー・タラントーラは、ロボット工学や機械工学から自動車工学まで、さまざまな新興技術について 10 年以上取材しているジャーナリストです。
- コンピューティング
クロードチャットはAIトレーニングに使用されますが、
最も人気のあるAIチャットボットの一つであり、AppleのSiri強化候補にも挙げられるClaudeは、AIトレーニングのために、まもなくすべてのチャットの記録を保存するようになります。Anthropicが発表したポリシー変更は既にユーザーへの通知が開始されており、9月28日までに利用規約に同意する必要があります。
何が変わるのでしょうか?
続きを読む
- コンピューティング
ハッカーが人気のAIツールをサイバー犯罪マシンに変えた
AIチャットボット「クロード」の開発者は、テクノロジーがますます高度化するにつれ、サイバー犯罪者によるAIツールの利用が増加していると、厳しい警告を発した。
人気の AI チャットボット「クロード」を開発する企業は、テクノロジーがますます高度化するにつれ、サイバー犯罪者による AI ツールの利用が増加していると、厳しい警告を発した。
Anthropic は最新の脅威インテリジェンスレポートで、ハッカーが AI ツールを使用して多数の企業や組織を標的としたサイバー攻撃を開始した最近の事例を詳しく説明しました。
続きを読む
- コンピューティング
残忍なAIチェスボットに不意打ち?これは人間のように考える
さあ、オンラインでアリーと運試しをしてみましょう。ただし、油断は禁物ですよ!
長年にわたり、チェスはAIが人間の知性にどこまで対抗できるかを示すリトマス試験紙とされてきました。1997年、IBMのスーパーコンピューター「ディープ・ブルー」がチェスの世界チャンピオン、ガルリ・カスパロフに勝利した時、それは転換点とみなされました。ウォール・ストリート・ジャーナル紙はこれを「人類にとっての大きな後退」と評しました。
しかし、人類にとって完全な道のりだったわけではありません。わずか1ヶ月前、ノルウェーのチェスのグランドマスター、マグヌス・カールセンがChatGPTをチェスの対局で、駒を一つも失うことなく破りました。興味深いことに、AIボットも対戦しています。今月初めには、OpenAIのGPT-o3推論モデルを基盤とするChatGPTが、イーロン・マスク率いるxAIが開発したAIチャットボットGrokをチェスのトーナメントで破りました。
続きを読む