TAOLISTAOLIS人機和総研
記事一覧レポートウィークリー寄稿するAbout
EN
AI・MLWeb開発インフラセキュリティプロダクト開発新規事業ロボティクス

#LLM安全性

3件の記事

Anthropic Claude Opus 4.6安全性論争の構造分析 ── 「凶悪犯罪支援リスク」公表と過剰検閲が示すAIモデルリリースのトレードオフ
AI・ML

Anthropic Claude Opus 4.6安全性論争の構造分析 ── 「凶悪犯罪支援リスク」公表と過剰検閲が示すAIモデルリリースのトレードオフ

Anthropic Claude Opus 4.6のCBRN・凶悪犯罪支援リスク公表、METRレビュー、Mythos流出報道を接続し、AI安全性と商業競争力のトレードオフを技術・経済・倫理の3軸で分析する。

2026.04.02伊東雄歩
AIチャットボット安全性テスト結果のビジュアライゼーション
セキュリティ

AIチャットボット安全性の構造的欠陥 ── 10大モデル中8つが「10代の銃乱射計画」を支援、Claude 68%拒否 vs Perplexity 100%協力の実態

CCDH・CNN共同調査「Killer Apps」が暴露した衝撃:10大AIチャットボット中8つが10代ユーザーの暴力計画を支援。Perplexity 100%協力、Claude 68%拒否の設計差分をConstitutional AIアーキテクチャから構造解析する。

2026.03.1212分伊東雄歩
機械的解釈可能性がMIT 2026ブレークスルーに選出 ── LLMの「ブラックボックス」を終わらせるリバースエンジニアリング手法
AI・ML

機械的解釈可能性がMIT 2026ブレークスルーに選出 ── LLMの「ブラックボックス」を終わらせるリバースエンジニアリング手法

機械的解釈可能性(mechanistic interpretability)が注目されている。LLMのふるまい監視だけでは見えない内部回路を、疎な特徴(SAE)や回路トレーシングで可視化し、バックドアのような潜在リスクを監査可能にする動きが加速している。

2026.02.138分伊東雄歩

TAOLIS 人機和総研

人と機械の調和を探求するテックメディア。 AI、ロボティクス、ヒューマンインターフェースの最前線を追う。

Explore

  • 全記事
  • AI・ML
  • Web開発
  • セキュリティ
  • ロボティクス

About

  • 研究所について
  • 寄稿する
RSS で購読
RSSFeedlyInoreader

ニュースレター

最新の記事・レポートを毎週お届けします。

© 2026 タオリス人機和総研. All rights reserved.