Blog ~ f-mignon代表による、できれば役立って欲しい情報ブログ

再帰的自己改善とは何か:AnthropicのAI安全性提案を深掘り

AIは、便利なチャットツールから、AIそのものを開発する道具へと変わり始めています。では、もしAIの進化が人間の制度や安全対策の速度を超えそうになったとき、誰がブレーキを踏めるのでしょうか。 Anthropicが提案した […]

続きを読む

2026年6月6日 6:12 PM  カテゴリー: AI, AI安全性/危険性, Anthropic, OpenAI

Claude Mythosだけが危ないのか?AIセキュリティ時代に見落とされがちな本当の論点

最近、チームみらいが煽っているせいか、Claude Mythosの脅威が何となく一人歩きしているようなのを感じる。こういう表現をするとチームみらいをディスっているように見えるがそこはそうではない。煽った方がいい。政府もき […]

続きを読む

2026年5月27日 12:32 AM  カテゴリー: AI, AI安全性/危険性, Anthropic, ChatGPT, Claude

METRがAIエージェントの内部利用リスクを評価、Anthropic・Google・Meta・OpenAIが参加

[TOC] AIエージェントは、どこまで自律的に動けるようになったのか AIエージェントは、もはや質問に答えるだけのチャットツールではありません。コードを書き、実験環境を整え、ログを読み、社内システムを操作する存在になり […]

続きを読む

2026年5月26日 12:22 AM  カテゴリー: AI, AI安全性/危険性, Anthropic, META, OpenAI

OpenAI、ChatGPTにTrusted Contactを導入:自傷リスク時に信頼できる相手へ通知

OpenAIは、ChatGPTで成人向けの任意安全機能「Trusted Contact」を段階的に提供開始しました。 深刻な自殺リスクが疑われる会話では、自動検知と訓練を受けた人間のレビューを経て、登録済みの信頼できる相 […]

続きを読む

2026年5月10日 1:38 AM  カテゴリー: AI, ChatGPT, OpenAI

OpenAIがAWSに本格展開、Microsoft独占見直しで企業AI導入はどう変わるのか

OpenAIは、AWSのAmazon Bedrock上でOpenAIモデル、Codex、Managed Agentsを限定プレビュー提供します。 その直前、MicrosoftとOpenAIは契約を見直し、OpenAIがA […]

続きを読む

2026年5月3日 11:13 PM  カテゴリー: AI, Amazon, ChatGPT, OpenAI