[ ICT ]

【電子版】英ディープマインド、一つの学習から多数のタスク同時処理 大規模分散型のAI手法を開発

(2018/2/13 15:30)

  • 「DMLab-30」の画像(ディープマインドの資料から)

米アルファベット傘下の英ディープマインドは、トレーニングを行った一つの深層強化学習エージェントをもとに、トレーニングしていないほかの多数のエージェントがそれぞれの作業を効率的にこなせる分散型人工知能(AI)システムを開発した。ある領域で学習させたモデルを別の領域に適応させる「転移学習(トランスファーラーニング)」に使える。AIのトレーニング時間を短くしたり、ハードウエアのプロセッシングパワーが小さくて済んだりといった効果が期待できる。

大規模分散型の深層強化学習アーキテクチャーで、「IMPALA」と名付けた。ある学習エージェントの経験を生かして、各エージェントがタスクをこなすだけでなく、エージェント間で学習内容を同時にアップデートできる。このアルゴリズムを搭載した機械1台をトレーニングし、データ効率はそのままに何千台もの機械へのスケールアップも可能という。

ディープマインドの深層強化学習について30のマルチタスク試験が行える「DMLab-30」や57のアタリのテレビゲームを同時に実行する「Atari-57」で試したところ、ディープマインドが2016年に発表した分散型強化学習アルゴリズム「A3C」に比べてデータ効率が10倍と、10分の1のデータ量で済んだ。学習内容をエージェント間でシェアできることなどから性能も高く、ゲームではA3Cの2倍の得点が得られたとしている。

(2018/2/13 15:30)

関連リンク

ICTのニュース一覧

おすすめコンテンツ

今日からモノ知りシリーズ 
トコトンやさしいボイラーの本

今日からモノ知りシリーズ トコトンやさしいボイラーの本

シッカリ学べる! 
照明系・投光系光学設計の基礎知識

シッカリ学べる! 照明系・投光系光学設計の基礎知識

事故事例から学ぶ 
材料力学と強度設計の基礎

事故事例から学ぶ 材料力学と強度設計の基礎

<新版>【松原流】戦略マップ/BSCとOKRの連携教本
双方の強みを活かしたビジネスモデル・イノベーション

<新版>【松原流】戦略マップ/BSCとOKRの連携教本 双方の強みを活かしたビジネスモデル・イノベーション

例題練習で身につく 
技術士第二次試験論文の書き方 第5版
2019年度改正<選択科目と必須科目の論文>対応!

例題練習で身につく 技術士第二次試験論文の書き方 第5版 2019年度改正<選択科目と必須科目の論文>対応!

図解よくわかる 
電車線路のはなし 第2版

図解よくわかる 電車線路のはなし 第2版

PR

カレンダーから探す

閲覧ランキング
  • 今日
  • 今週

ソーシャルメディア

日刊工業新聞社トピックス

セミナースケジュール

イベントスケジュール

もっと見る

PR

おすすめの本・雑誌・DVD

↓もっと見る

ニュースイッチ

企業リリース Powered by PR TIMES

専門紙ヘッドライン

専門紙

↓もっと見る

海外ニュース

↓もっと見る

大規模自然災害時の臨時ID発行はこちら

日刊工業新聞社関連サイト・サービス

マイクリップ機能は会員限定サービスです。

有料購読会員は最大300件、無料登録会員は最大30件の記事を保存することができます。

会員登録/ログイン