セミナー概要

自己注意機構を活用したニューラルネットワークであるTransformerは、機械翻訳タスクでSoTAを達成し実用化を加速させています。このTransformerをコンピュータビジョンタスクに適用したモデルがVision Transformerであり、2019年以降、急速に応用と改良が加えられています。

Vision Transformerは、CNNとは異なる新たな特徴表現獲得が可能となり、テクスチャノイズに対してロバストな認識が可能となっています。

本セミナーではVision Transformerについて従来の手法と対比しながらその仕組みと特長について解説し、コンピュータビジョン応用として物体検出、自己教師あり学習、さらには自動運転分野で注目されるBEV Perceptionについて詳しく解説いたします。

受講対象者

  • コンピュータビジョンの最新技術を学びたい方
  • Vision Transformerの仕組みを理解したい方
  • 自動運転技術(BEV Perception)に興味のある方
  • AI・機械学習エンジニア
  • 研究開発に携わる技術者

セミナー内容

  • 1. 再帰型ニューラルネットワークの仕組み

    1.1 再帰型ニューラルネットワーク(RNN)
    1.2 LSTM
    1.3 Seq2seq、Attention Seq2seq

  • 2. Transformerの仕組み

    2.1 Transformer
    2.2 大規模言語モデル

  • 3. Vision Transformerの仕組み

    3.1 特徴表現獲得の変遷
    3.2 Vision Transformer(ViT)
    3.3 ViTによる画像認識
    3.4 ViTによる特徴表現獲得
    3.5 ViTベースの物体検出、セマンティックセグメンテーション
    3.6 ViTの自己教師あり学習

  • 4. ViTの最新動向

    4.1 ViTの派生手法(Swin Transformer、ConvNeXtなど)
    4.2 ViTの派生手法の傾向

  • 5. TransformerによるBEV Perception

    5.1 Bird’s-Eye-View(BEV)空間
    5.2 BEVベースの3D物体検出:BEVFormer, BeVerse
    5.3 BEVベースの自動運転:UniAD

講師紹介

藤吉弘亘(ふじよしひろのぶ)氏
中部大学 工学部 情報科学科 / 大学院 工学研究科 情報工学専攻 教授(博士(工学))

略歴

1997年 中部大学大学院 博士後期課程了
1997〜2000年 米国カーネギーメロン大学 ロボット工学研究所 Postdoctoral Fellow
2000年 中部大学 講師
2004年 中部大学 准教授
2005〜2006年 米国カーネギーメロン大学 ロボット工学研究所 客員研究員
2010年 中部大学 教授
2014年 名古屋大学 客員教授
現在に至る

主な受賞

  • ロボカップ研究賞(2005年)
  • 情報処理学会論文誌CVIM優秀論文賞(2009年)
  • 情報処理学会山下記念研究賞(2009年)
  • 画像センシングシンポジウム優秀学術賞(2010, 2013, 2014年)
  • 電子情報通信学会 情報・システムソサイエティ論文賞(2013年)

学会

電子情報通信学会、情報処理学会、ロボット学会、IEEE

研究分野

計算機視覚、動画像処理、パターン認識・理解の研究に従事

お申し込み

受講料:53,900円(税込)

定価:本体49,000円+税4,900円

E-Mail案内登録価格:本体49,000円+税4,900円

今すぐ申し込む

※開催7日前に請求書を発送します

※開催日から9日前以降のキャンセルは受講料全額を申受けます

お問い合わせ

📧

メール

info@ecompress.co.jp

📞

電話

050-3733-8134

📠

FAX

03-6745-8626

株式会社イーコンプレス 丁田

〒630-0244 奈良県生駒市東松ヶ丘1-2 奥田第一ビル102

TEL:050-3733-8134 FAX:03-6745-8626