AIは、便利なチャットツールから、AIそのものを開発する道具へと変わり始めています。では、もしAIの進化が人間の制度や安全対策の速度を超えそうになったとき、誰がブレーキを踏めるのでしょうか。 Anthropicが提案した […]
続きを読むBlog ~ f-mignon代表による、できれば役立って欲しい情報ブログ
再帰的自己改善とは何か:AnthropicのAI安全性提案を深掘り
Claude Mythosだけが危ないのか?AIセキュリティ時代に見落とされがちな本当の論点
最近、チームみらいが煽っているせいか、Claude Mythosの脅威が何となく一人歩きしているようなのを感じる。こういう表現をするとチームみらいをディスっているように見えるがそこはそうではない。煽った方がいい。政府もき […]
続きを読む2026年5月27日 12:32 AM カテゴリー: AI, AI安全性/危険性, Anthropic, ChatGPT, Claude
METRがAIエージェントの内部利用リスクを評価、Anthropic・Google・Meta・OpenAIが参加
[TOC] AIエージェントは、どこまで自律的に動けるようになったのか AIエージェントは、もはや質問に答えるだけのチャットツールではありません。コードを書き、実験環境を整え、ログを読み、社内システムを操作する存在になり […]
続きを読む2026年5月26日 12:22 AM カテゴリー: AI, AI安全性/危険性, Anthropic, META, OpenAI
OpenAI、ChatGPTにTrusted Contactを導入:自傷リスク時に信頼できる相手へ通知
OpenAIは、ChatGPTで成人向けの任意安全機能「Trusted Contact」を段階的に提供開始しました。 深刻な自殺リスクが疑われる会話では、自動検知と訓練を受けた人間のレビューを経て、登録済みの信頼できる相 […]
続きを読む