Firefly®を用いたエッジの推定
はじめに
ディープラーニングは、既存のアプリケーションを変革し、新たな産業の発展を推進する斬新な技術です。 ネットワークの作成とトレーニングへのGoogle、Amazon、Intel、Nvidiaからのツールの可用性により技術へのアクセスが向上し、競争力の高い製品とともに新しい担い手が既存市場に参入できるようになります。
ディープラーニングの潜在可能性が広範に認知されています。 今まさに、ご自分のアプリケーションでのディープラーニングの活用に取り組むことができます。 Teledyne FLIRは、マシンビジョン開発者がこの技術を活用できるようにする方法についても考えました。 その成果が、間もなく当社から発売するFirefly®カメラであり、トレーニングされたネットワークを現場で容易に展開できるようになります。 Firefly®は、高品質の Sony PregiusイメージセンサーとGenICam準拠のIntel Movidius Myriad 2 Vision Processing Unit(ビジョン・プロセシング・ユニット)(VPU)を統合することにより、マシン・ビジョンをディープラーニング推論と融合させています。
VPUとは何か?
Firefly®の核心をなすIntel Movidius Myriad 2 Vision Processing Unit (VPU)は、新しいクラスのプロセッサです。 VPUでは、高速ハードウェア画像処理フィルタ、汎用CPUコア、並列ベクトル処理コアを組み合わせています。 カメラ上の推論を促進するのに使用されているベクトルコアは、GPUに見られる汎用コアよりもニューラルネットワークの分岐論理に対し、より最適化されています。 最適化の程度が向上したため、VPUではほとんど電力を消費することなく、高水準の性能を達成できるようになります。
「推論」とは何か?
「推論」とは、新たに取得されたラベルのない実世界のデータに関するディープラーニングの応用です。 推論とは、新しいデータに基づいて推測を行うようトレーニングされたニューラルネットワークの結果です。
図1. 「推論」とは、新しくラベルのないデータ(B)へのラベル付きデータ(A)でトレーニングされたモデルの応用です。
推論に使用できるネットワークにはさまざまな種類がありますが、画像分類を行うのに非常にうまく適合しています。 MobileNetは、モバイルデバイス上で高精度の画像分類と画像分割を行えるよう、当初Googleが設計しました。 これにより、大型で消費電力の大きいGPUを必要とするはるかに計算コストの高いネットワークと同様の精度が実現しています。
推論カメラは、「スマートカメラ」と比べてどうですか?
従来のスマートカメラは、マシンビジョンカメラとルールベースの画像処理ソフトウェアを実行するシングルボードコンピュータを組み合わせています。 スマートカメラは、バーコードの読み取りや、「この部分には、想定されている穴がありますか」といった質問への回答などの単純な問題にはすばらしい解決策となります。 推論カメラは、「これは輸出等級のリンゴですか?」など、より複雑で主観的な質問に優れています。 既知の良好な画像を使用してトレーニングされている場合には、推論カメラは、ルールベースの検査システムでは認識されない予想外の欠陥を容易に識別でき、ばらつきへの耐性が向上します。
推論カメラは、豊富な記述メタデータで既存のアプリケーションを増強するのに使用することができます。 GenICamチャンクデータを用いながら、Firefly®では推論を活用して、従来のルールベース画像処理を実行するホストに渡される画像にタグを付けることができます。 このようにして、ユーザーはその既存のビジョンシステムの機能を迅速に拡張できます。 このハイブリッドシステムアーキテクチャは、従来のビジョンシステムをトリガするのにも使用できます。
従来のスマートカメラで使用されていた計算ハードウェアは電力効率が低く、Firefly®のVPUよりもはるかに大きいため、Fireflyを使用すると大幅なスペースの節約につながります。 ちょうど27 mm x 27 mmのFireflyは、狭いスペースに統合させる準備が整っています。
Firefly®は、オープン・プラットフォームです。 これにより、そのトレーニングと最適化のためにディープラーニング・ネットワークと関連するツールチェーンの迅速なペースを活用する柔軟性がユーザーにもたらされます。 対称的にスマートカメラは、独自のツールを使用してプログラミングされており、最新の進歩から後れを取っていることがあります。
撮影中推論の利点は何ですか
ビジョンシステムのエッジの推論が可能となることで、システムの速度、信頼性、電力効率、安全性(セキュリティ)が向上します。
- 速度: その他の形式のエッジコンピューティングと同様に、エッジの推論により画像処理が中央サーバーから遠ざかり、データソースに近づくようになります。 画像全体をリモートサーバーに送信するのではなく、記述データのみ送信するだけで済みます。 これにより、システムで送信する必要があるデータの量が大幅に削減され、ネットワーク帯域幅とシステム待ち時間が最小限に抑えられます。
- 信頼性: 特定用途では、Firefly®によりサーバー・ネットワークインフラへの依存がなくなり、その信頼性が向上します。 その内蔵VPUとともに、Fireflyはスタンドアロン(独立型)センサーとして動作します。 これにより画像を取得し、それに基づき決定を行い、次いでGPIOシグナリングを使用してアクションをトリガーすることができます。
- 電力効率:必要な場合にのみビジョンシステムをトリガーするということは、より多くの処理時間を従来のルールベースの画像処理・解析に費やすことができるようになるということです。 ディープラーニング推論は、特定の条件が満たされているときに高性能画像解析をトリガーするのに使用できます。 Myriad 2 VPUは、縦続回路網をサポートすることで、さらに省エネを実現します。 これにより、以前のネットワークの条件を満たす場合にのみ呼び出される、より複雑な高性能ネットワークとともに複数層の解析が可能となります。
- セキュリティ:送信される少量のデータは容易に暗号化され、システムのセキュリティが向上します。
どのようにして始めれば良いのでしょうか?
Fireflyにより、研究・開発(R&D)から得られたディープラーニングを自分のアプリケーションでの作業に取り入れる道筋が整います。 これはいつでもスタンドアロンセンサーとして機能することができ、画像を取得してそれに基づく決定を行い、GPIOアクションをトリガーします。 Fireflyは2019年に提供される予定ですが、現在はエッジ推論から始めることができます。 発売予定FLIR Fireflyの核心であるIntel Myriad 2 VPUは、Intel Neural Compute Stickで提供されています。
Intel Neural Compute Stickを使用すると、エッジビジョンシステムの完全な推論は、1000ドル未満で構築できます。 Intel OpenVINOツールキットとともに、ビジョンシステム開発者は、Firefly®での撮影中推論に電力を供給するのと同じVPUでニューラルネットワークの性能を容易に最適化し検証することができます。 これにより、ユーザーは、同じカメラを用いた従来のアルゴリズムと並行してMyriad 2を電力源とする推論の性能を正確に評価できるようになります。
図2. GPUトレーニングからNeural Compute Stick開発、Firefly®展開への移行
結論
ディープラーニング推論により、ビジョンシステムの設計・プログラミング方法に根本的な変化が生じます。 これにより、複雑で主観的な意思決定を、従来のルールベースのアプローチを使用して達成しうるものよりも迅速かつ正確に行えるようになります。 The Fireflyは、Sony Pregiusセンサー、GenICamインタフェース、Intel Movidius Myriad 2を組み合わせることにより、マシンビジョンをディープラーニングと融合させています。 この新しいクラスの「推論」カメラにより、マシンビジョン用途でのディープラーニング推論の展開への理想的な道筋がもたらされます。 現在、Intel Neural Compute Stickを用いて、Firefly®の開発を始めることができます。