[ ICT ]

【電子版】英ディープマインド、一つの学習から多数のタスク同時処理 大規模分散型のAI手法を開発

(2018/2/13 15:30)

  • 「DMLab-30」の画像(ディープマインドの資料から)

米アルファベット傘下の英ディープマインドは、トレーニングを行った一つの深層強化学習エージェントをもとに、トレーニングしていないほかの多数のエージェントがそれぞれの作業を効率的にこなせる分散型人工知能(AI)システムを開発した。ある領域で学習させたモデルを別の領域に適応させる「転移学習(トランスファーラーニング)」に使える。AIのトレーニング時間を短くしたり、ハードウエアのプロセッシングパワーが小さくて済んだりといった効果が期待できる。

大規模分散型の深層強化学習アーキテクチャーで、「IMPALA」と名付けた。ある学習エージェントの経験を生かして、各エージェントがタスクをこなすだけでなく、エージェント間で学習内容を同時にアップデートできる。このアルゴリズムを搭載した機械1台をトレーニングし、データ効率はそのままに何千台もの機械へのスケールアップも可能という。

ディープマインドの深層強化学習について30のマルチタスク試験が行える「DMLab-30」や57のアタリのテレビゲームを同時に実行する「Atari-57」で試したところ、ディープマインドが2016年に発表した分散型強化学習アルゴリズム「A3C」に比べてデータ効率が10倍と、10分の1のデータ量で済んだ。学習内容をエージェント間でシェアできることなどから性能も高く、ゲームではA3Cの2倍の得点が得られたとしている。

(2018/2/13 15:30)

関連リンク

ICTのニュース一覧

おすすめコンテンツ

自動車用途で解説する!材料接合技術入門

自動車用途で解説する!材料接合技術入門

今日からモノ知りシリーズ 
トコトンやさしい微生物の本

今日からモノ知りシリーズ トコトンやさしい微生物の本

今日からモノ知りシリーズ 
トコトンやさしいダムの本

今日からモノ知りシリーズ トコトンやさしいダムの本

機械製図CAD作業技能検定試験 1・2級実技課題と解読例
第2版

機械製図CAD作業技能検定試験 1・2級実技課題と解読例 第2版

「電験三種」ビギナーのための数学再入門
「小学校・中学校・高校」レベルからステップアップ

「電験三種」ビギナーのための数学再入門 「小学校・中学校・高校」レベルからステップアップ

今日からモノ知りシリーズ 
トコトンやさしい電気の本
第2版

今日からモノ知りシリーズ トコトンやさしい電気の本 第2版

PR

カレンダーから探す

閲覧ランキング
  • 今日
  • 今週

ソーシャルメディア

日刊工業新聞社トピックス

セミナースケジュール

イベントスケジュール

もっと見る

PR

おすすめの本・雑誌・DVD

↓もっと見る

ニュースイッチ

企業リリース Powered by PR TIMES

専門紙ヘッドライン

専門紙

↓もっと見る

大規模自然災害時の臨時ID発行はこちら

日刊工業新聞社関連サイト・サービス

マイクリップ機能は会員限定サービスです。

有料購読会員は最大300件、無料登録会員は最大30件の記事を保存することができます。

会員登録/ログイン