ベース・ツールキット
ダイレクト ・プログラミングを実現するデータ並列 C++ (DPC++) コンパイラー
本製品に含まれるコンパイラーとライブラリーを使用することで、 AI アクセラレーション向けインテル® ディープラーニング ・ブースト (インテル® DL ブースト) を含むインテル® アドバンスト ・ ベクトル ・ エクステンション 512 (インテル® AVX-512) 対応の第 3 世代インテル® Xeon® スケーラブル ・プロセッサー等、最新のハードウェアの最先端の機能をすべて活用し、インテルの CPU、 GPU、 FPGA のパフォーマンスを最大限に引き出すことで、 計算を高速化します。
製品には、ハードウェア・ターゲット間でコードを再利用し、CPU、GPU、および FPGA アーキテクチャーで高い生産性とパフォーマンスを実現するインテル® oneAPI DPC++/C++ コンパイラー、インテル® oneAPI DPC++ 互換性ツール、インテル® oneAPI DPC++ ライブラリー、スレッド/数学/マルチメディア/信号処理パフォーマンス・ライブラリー、解析/エラー検出/並列化アドバイス/デバッグツール、数学パフォーマンス・ライブラリーを活用した Python* パッケージが含まれています。
インテル® oneAPI DPC++/C++ コンパイラー
データ並列 C++、 C++、 C、 SYCL、 および OpenMP* をサポートする標準ベースのクロスアーキテクチャー ・ コンパイラーです。実績のある LLVM コンパイラー ・ テクノロジーとコンパイラーを主導してきたインテルの経験を活用して、 優れたパフォーマンスを実現します。 主要なコンパイラー、 開発環境、 オペレーティング ・ システムとのシームレスな互換性を提供します。
OpenMP* 並列プログラミング仕様を利用して、スレッド化とベクトル化を行うことでパフォーマンスをさらに向上できます。
ツールは主要な開発環境とシームレスに統合され、開発者の生産性を高めます。また、拡張された最適化レポートとインテル® VTune™ プロファイラーおよびインテル® Advisor の統合により、開発者はコードのプロファイルを制御できます。
インテル® DPC++ 互換性ツール
CUDA ソースコードを DPC++ コードへ移行するのを支援します。
インテル® oneAPI DPC++ ライブラリー
生産性を高めるアルゴリズムと関数によりデータ並列ワークロードを高速 化します。
インテル® oneAPI ベース・ツールキット用インテル FPGA アドオン
再構成可能なハードウェア・アクセラレーターをプログラムして、特殊なデータセントリックのワークロードを高速化します。インテル® oneAPI ベース・ツールキットをインストールする必要があります。
インテル® ディストリビューションの GDB
効率良くコードをトラブルシューティングするのに役立ちます。
インテル® ディストリビューションの Python*
インテル® ディストリビューションの Python* は、パフォーマンス指向の統合型ディストリビューションで、Python* アプリケーションを高速化します。
強力なインテル® パフォーマンス・ライブラリーを使用して、最適化されたアルゴリズム、スレッド化、ベクトル化機能を活用し、NumPy*/SciPy*/scikit-learn のような Python* 計算パッケージのパフォーマンスを向上できます。
別の方法として、Numba* で (LLVM) JIT コンパイル、Cython* で Python* を C コンパイルしてパフォーマンスを引き出すこともできます。
ディストリビューションは pip および conda と互換で、Windows*、macOS*、Linux* で利用可能です。
インテル® oneMKL
数学ライブラリー
インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) には、アプリケーションのパフォーマンスを向上して開発時間を短縮します。
最新のプロセッサーは、コア数が増加し、ベクトルユニットがより広くなり、改良されたアーキテクチャーを採用しています。すべての処理能力を活用する最も簡単な方法は、この高度に最適化された算術演算ライブラリーを使用することです。
インテル® oneMKL には、線形代数、高速フーリエ変換、ニューラル・ネットワーク、ベクトル演算、統計、その他の高度な関数を含む、さまざまなルーチンが含まれています。単一の C または Fortran API 呼び出しにより、最適なコードパスが選択され、これらの関数は、現在、将来のプロセッサー・アーキテクチャーに合わせて自動的にスケーリングします。
インテル® oneDAL
データ解析およびマシンラーニング・ライブラリー
インテル® oneAPI データ・アナリティクス・ライブラリー (インテル® oneDAL) は、高度に最適化されたマシンラーニングと高速なビッグデータ解析を実現します。
この包括的なライブラリーは、データ解析処理のすべての段階 (前処理、変換、解析、モデリング、意思決定) を高速化し、エッジからクラウドまで、オフライン、ストリーミング、分散型使用モデルをサポートします。
インテル® oneDAL は、スレッド化とベクトル化を最大限に活用し、最高のパフォーマンスを引き出せるようにデータの取り込みとアルゴリズムの計算を最適化します。
アルゴリズムの透明性を示しコミュニティーに貢献するためオープンソース・バージョンも提供されています。
インテル® IPP
画像、信号、データ処理アプリケーション向けに最適化されたビルディング・ブロック
インテル® インテグレーテッド・パフォーマンス・プリミティブ (インテル® IPP) を使用して、高度に最適化された画像処理、信号処理、セキュリティー、ストレージ・アプリケーションを作成できます。
この高度なツールは、最新の命令セットを活用してインテル® プロセッサーの能力を引き出す、最適化された低水準 API を提供します。これらの最適化は、多くの計算ドメイン (特に信号処理、画像処理、データ処理) を高速化します。
クロス OS のサポートおよび最良の最適化パスを選択する内部ディスパッチャーにより、複数の世代のプロセッサーで機能する移植性に優れたコードを素早く作成することができます。
インテル® oneTBB
スレッド・ライブラリー
インテル® oneAPI スレッディング・ビルディング・ブロック (インテル® oneTBB) は、ループやタスクベースのアプリケーションで並列パフォーマンスとスケーラビリティーを簡単に利用できます。
このツールにより、コア数の増加に伴ってパフォーマンスがリニアにスケーリングする、プラットフォームの詳細やスレッド化のメカニズムが抽象化された強固なアプリケーションを開発することができます。
マルチコアおよびメニーコア・ハードウェアの電力とパフォーマンスを効率良く使用する最適なスレッド・スケジュールとワーク分割を自動的に決定します。
インテル® oneVPL
ビデオ処理ライブラリー
インテル® oneAPI ビデオ・プロセシング・ライブラリー (インテル® oneVPL) は、ブロードキャスト、ライブ・ストリーミング、VOD、クラウドゲームなどに高速で、高品質な、リアルタイムのビデオデコード、エンコード、トランスコード、処理を提供します。
インテル® oneCCL
コレクティブ・コミュニケーション・ライブラリー
インテル® oneAPI コレクティブ・コミュニケーション・ライブラリー (インテル® oneCCL) は、最適化された通信パターンを実装して、ディープラーニングやマシンラーニング・モデルのトレーニングを複数のノードに分散します。
インテル® oneDNN
ディープ・ニューラル・ネットワーク・ライブラリー
インテル® oneAPI ディープ・ニューラル・ネットワーク・ライブラリー (インテル® oneDNN) は、パフォーマンスを最適化したビルディング・ブロックを使用して、インテルの CPU および GPU 上で高速なニューラル・ネットワークを開発できます。
インテル® VTune™ プロファイラー
パフォーマンス・プロファイラー
-
広範なプロファイル作成機能
単純なアプリケーションのチューニングを行う場合でも、スレッド化された MPI アプリケーションの高度なパフォーマンス最適化を行う場合でも、インテル® VTune™ プロファイラーで必要なデータを取得可能。hotspot、スレッド化、ロックと待機、DirectX*、OpenCL*、OpenMP*、帯域幅、キャッシュ、ストレージ・レイテンシーなどに関する豊富なパフォーマンス・データを収集します。コンテナー内のプロファイルも可能です。
-
生産性
良いデータがあっても、それを役立てることができなければ意味がありません。データを考察するにはマイニングが必要です。強力な解析により、タイムラインやソースコードで結果をソート、フィルター、視覚化して時間を節約できます。
-
C、C++、Fortran、Python*、Go*、Java* に対応
シングルコード・プロファイラーとは異なりインテル® VTune™ プロファイラーは言語が混在したコードの hotspot を正確に特定します。
インテル® Advisor
ベクトル化/スレッド化アドバイザー
最近のプロセッサーでは、ベクトル化とスレッド化を行ったコードは非常に高速に実行できます。しかし、コードがベクトル化できない理由を理解することは容易ではありません。
インテル® Advisor は、C、C++、C#、Fortran ソフトウェア・アーキテクト向けの高性能ベクトル化/スレッド化プロトタイプ生成ツールです。
新しいルーフライン解析機能は、パフォーマンスへの影響が大きく、最適化が不十分なループを特定して最適化を単純化します。安全に効率良くベクトル化できるように、反復回数、データ依存性、メモリー・アクセス・パターンなどの必要なキーデータを取得します。
インテル® AVX-512 対応ハードウェアがない場合でも、最新のインテル® AVX-512 命令セット向けの最適化を行えます。
OpenMP
標準規格に基づいた並列モデル
OpenMP* は、ハイパフォーマンスな並列化およびベクトル化されたアプリケーションの作成を単純化するディレクティブ・ベースのコンパイラー拡張機能です。OpenMP* を使用すると、SIMD 命令を活用した移植性に優れたアプリケーションを作成できます。
OpenMP* はインテル® C/C++ コンパイラーとインテル® Fortran コンパイラーにシームレスに統合されます。Windows* および Linux* でサポートされています。
OpenMP* 関連の情報については、こちらを参照ください。
HPCツールキット2022(ベースツールキットにアドオン)
クラスター向けソフトウェア開発のための C/C++、Fortran コンパイラー、 チューニングツール、最適化された MPI ライブラリーが同梱
ベース・ツールキットの機能に加え、MPI-3 規格に対応した MPI ライブラリーや、MPI 通信によるパフォーマンスの問題となる箇所を素早く発見する性能解析ツールが含まれています。
インテル® アーキテクチャー・ベースのクラスター向けにハイパフォーマンスなプログラム開発をするためには本製品が最適です。
ターゲット・プラットフォームのメモリーシステムの種類により、シングルノードとマルチノードの 2 つの製品が提供されます。
シングルノード: PC、ラップトップ、ワークステーションを含む共有メモリーシステムのターゲット・プラットフォーム向け
マルチノード: PC、ラップトップ、ワークステーションを含む共有メモリーシステムに加え、HPC クラスターを含む分散メモリーシステムのターゲット・プラットフォーム向け
アプリケーションを作成してクラスターシステムなどの分散メモリーシステムで実行する場合は、シングルノードではなく、マルチノードをご利用ください。
インテル® Fortran コンパイラー
Fortran と OpenMP* をサポートする標準ベースの CPU および GPU コンパイラーです。実績のある LLVM コンパイラー・テクノロジーとコンパイラーを主導してきたインテルの経験を活用して、優れたパフォーマンスを実現します。主要なコンパイラー、開発環境、オペレーティング・システムとのシームレスな互換性を提供します。
インテル® C/C++ コンパイラー・クラシック
最新のインテル® プラットフォーム上で最新の言語標準規格 (C++17 ドラフトまで) を実装します。開発者は、優れた最適化と SIMD ベクトル化、インテル® パフォーマンス・ライブラリーとの統合、最新の OpenMP* 5.0 並列プログラミング・モデルの活用により、アプリケーションのパフォーマンスを向上できます。
主要な開発環境とのシームレスな統合により、開発者の生産性を高めます。Visual C++* コンパイラーおよび GNU* C コンパイラーとソース互換です。
拡張された最適化レポートとインテル® VTune™ プロファイラーおよびインテル® Advisor の統合により、開発者はコードのプロファイルを制御できます。
インテル® Fortran コンパイラー・クラシック
最新のインテル® プラットフォーム上で最新の Fortran 言語標準規格を実装して、アプリケーションのパフォーマンスを向上します。
Fortran 2018 標準規格をサポートし、インテル® マス・カーネル・ライブラリー (インテル® MKL) との互換性があります。FORTRAN 77 との互換性もあります。
OpenMP* 並列プログラミング仕様を利用して、スレッド化とベクトル化を行うことでパフォーマンスをさらに向上できます。
ツールは主要な開発環境とシームレスに統合され、開発者の生産性を高めます。また、拡張された最適化レポートとインテル® VTune™ プロファイラーおよびインテル® Advisor の統合により、開発者はコードのプロファイルを制御できます。
インテル® Inspector
メモリー / スレッドのデバッガー
インテル® Inspector は、C、C++、Fortran アプリケーションのメモリーリーク、異常、デッドロック、データ競合などを特定してデバッグできます。
特別なコンパイラーや再コンパイルは必要ありません。通常のビルドを利用できます。ヒープ拡張解析とデバッガー・ブレークポイントは、発見が困難な問題の診断を単純化し、修正コストが少なくて済む開発サイクルの早期に発見できるようにします。
エラーが発生する状況にならなかった場合でも、実行されたコードパスの潜在的なエラーや、断続的および非決定的なエラーを発見します。
インテル® Trace Analyzer & Collector
MPI チューニングと解析
インテル® Trace Analyzer & Collector は、強力な MPI パフォーマンス・プロファイルおよび正当性解析ツールにより、MPI アプリケーションをプロファイルおよび解析します。
MPI プロセスの対話処理、ノードとトポロジーのグループ、プロファイル統計とロードバランス、通信 hotspot を示し、開発者が並列アプリケーションの動作を視覚化して確認できるようにします。
新しいスケーラブルな軽量のプロファイルにより 100K+ ランクのプロファイルが可能です。
インテル® Cluster Checker
クラスター診断エキスパート・システム
インテル® Cluster Checker は、汎用的なクラスター構成の適合性、均一性、状態、パフォーマンスを検証する強力な診断ユーティリティーです。クラスター・コンポーネントがクラスターのライフサイクルを通じてシームレスに連携して問題なく動作することを確認して、総所有コスト (TCO) を削減しつつ、稼働時間を増やして生産性を向上します。
インテル® Cluster Checker のエキスパート・システム・アーキテクチャーは、以下の機能によりスケーラビリティー、使いやすさ、診断能力を向上します。
・一般的な問題の解決策の提示
・主要コンポーネントのパフォーマンス検証
・ほかのソフトウェアに統合可能な API
・チェック機能のカスタマイズおよび拡張
・履歴データの格納
インテル® MPI ライブラリー
メッセージ・パッシング・インターフェイス・ライブラリー
インテル® MPI ライブラリーは、MPI レイテンシーを最小限に抑え、広範なインターコネクト・ファブリック (Infiniband*、Myrinet*、iWARP、TCP/IP など) で業界最先端のパフォーマンスと強固なスケーリングを実現します。
MPI ランタイムクラスターおよびパフォーマンスを最適化するアプリケーション固有のチューニングをサポートします。
インテル® C/C++ コンパイラーとインテル® Fortran コンパイラーに加えて、ノードレベルのメモリー、スレッド、プロファイル・ツール、インテル® VTune™ プロファイラー、インテル® Trace Analyzer & Collector などの強力なインテル® ソフトウェア開発ツールとの統合により、MPI アプリケーションの迅速な開発、プロファイル、解析が可能です。
IoTツールキット2022(ベースツールキットにアドオン)
ネットワークのエッジで動作するソリューションの開発を加速する統一されたクロスアーキテクチャー・プログラミング・モデル oneAPI IoTツールキット
インテル® oneAPI ベース & IoT ツールキットは、ヘルスケア、スマートホーム、産業、リテール、航空宇宙、セキュリティーなど、 グローバルな IoT エッジ・イノベーションにビッグデータ・テクノロジーの技術を取り入れようとしている開発者向けに作られています。 ビルド、解析ツールやライブラリーが強化されており、CPU、GPU、FPGA、その他のアクセラレーター・アーキテクチャーでのシステム設計、開発、展開を支援します。
近年の IoT エッジ・ワークロードは非常に多様化しており、その上で動作するアーキテクチャーも多様化しています。 すべてのワークロードに最適な単一のアーキテクチャーはありません。このツールキットを使用するメリットは以下の通りです。
・インテルの CPU、GPU、FPGA の各アーキテクチャーでのシステム設計、開発、導入を支援するビルドおよび解析ツールとライブラリーの強化
・ソフトウェア・スタック全体の統合の高速化、パフォーマンスと電力効率の最適化、市場投入までの時間の短縮
・OpenMP* やインテル® oneAPI スレッディング・ビルディング・ブロックなどのインテルのパフォーマンス・ライブラリーや並列プログラミング・モデルとの統合
・一般的なコンパイラー、開発環境、OS とのシームレスな互換性を実現
・デザインサイクルの初期段階でのスレッド、メモリー、永続的なメモリーのデバッグ
・電力関連指標やハードウェア固有の最適化を含む、システムの動作解析
・センサーとデバイス、デバイスとクラウドを結びつけるコネクティビティ・ツールとライブラリー
スマート・コネクテッド・デバイス開発のためのコンパイラー、高度な接続ツール、Linux* カーネル・ビルド・ツール
ベース・ツールキットの機能に加え、カスタム Linux* カーネルを開発し、センサーとデバイスを素早く接続するための IoT 開発ツールが含まれています。
インテル® C/C++ コンパイラー・クラシック
最新のインテル® プラットフォーム上で最新の言語標準規格 (C++17 ドラフトまで) を実装します。開発者は、優れた最適化と SIMD ベクトル化、インテル® パフォーマンス・ライブラリーとの統合、最新の OpenMP* 5.0 並列プログラミング・モデルの活用により、アプリケーションのパフォーマンスを向上できます。
主要な開発環境とのシームレスな統合により、開発者の生産性を高めます。Visual C++* コンパイラーおよび GNU* C コンパイラーとソース互換です。
拡張された最適化レポートとインテル® VTune™ プロファイラーおよびインテル® Advisor の統合により、開発者はコードのプロファイルを制御できます。
インテル® Inspector
インテル® Inspector は、C、C++、Fortran アプリケーションのメモリーリーク、異常、デッドロック、データ競合などを特定してデバッグできます。
特別なコンパイラーや再コンパイルは必要ありません。通常のビルドを利用できます。ヒープ拡張解析とデバッガー・ブレークポイントは、発見が困難な問題の診断を単純化し、修正コストが少なくて済む開発サイクルの早期に発見できるようにします。
エラーが発生する状況にならなかった場合でも、実行されたコードパスの潜在的なエラーや、断続的および非決定的なエラーを発見します。
Eclipse* IDE
Linux* での開発やデバッグ作業を効率化する、カスタマイズ済みの統合開発環境が含まれます。
Linux* カーネル・ビルド・ツール
Yocto Project* ベースのカスタム Linux* の作成とカスタマイズをサポートします。
IoT 接続ツール
センサーとデバイス、 デバイスとクラウドをつなぎます。
レンダリングツールキット2022(ベースツールキットにアドオン)
スケール感のあるフォトリアリスティック・レンダリングを実現。高忠実度でビジュアル体験を実現するレンダリングとレイトレーシング・ライブラリーのセット
インテル® oneAPI ベース & レンダリング・ツールキットは、高忠実度なビジュアル体験を実現するレンダリングおよび レイトレーシング・ライブラリーのセットで、これらの種のワークロードを高速化するように設計されています。 このライブラリーを使用することで、CPU、将来の Xe または GPU のレンダリング・パフォーマンスをあらゆる規模で最適化し、 強力なインテルのハードウェアを最大限に活用することができます。クリエイター、科学者、エンジニアは、 このツールキットを使って、素晴らしいスタジオ・アニメーションやビジュアルエフェクトを開発したり、 科学的、産業的なビジュアライゼーションを作成したりすることで、ビジュアライゼーションの可能性を広げることができます。
高忠実度のビジュアライゼーション ・アプリケーション開発を実現するレンダリング・ツール
ベース・ツールキットの機能に加え、インテル® Xeon® スケーラブル ・プロセッサーやその他のインテル® CPU、そして将来的にはインテル® Xe アーキテクチャーの GPU 向けに最適化されたオープンソースのレンダリング・ライブラリーを使用して、パフォーマンス、忠実度、拡張性、コスト効率に優れたビジュアライゼーション・アプリケーションやソリューションを開発できます。
また、高価な GPU ローカルメモリーであっても最大 48 GB しか利用ができないところ、インテル® oneAPI ベース & レンダリング・ツールキットを利用することで 1 ソケット最大 3TB のローカル・グラフィック・メモリーを使用できるようになります。
ターゲット・プラットフォームのメモリーシステムの種類により、シングルノードとマルチノードの 2 つの製品が提供されます。
シングルノード: PC、ラップトップ、ワークステーションを含む共有メモリーシステムのターゲット・プラットフォーム向け
マルチノード: PC、ラップトップ、ワークステーションを含む共有メモリーシステムに加え、レンダーファームを含む分散メモリーシステムのターゲット・プラットフォーム向け
インテル® Embree
ハイパフォーマンスで機能豊富なレイトレーシング & 写実的なレンダリングを実現
現在の GPU レイトレーシング & レンダリングの能力では三角形や直線、B-スプライン曲線、複数セグメント・モーション・ブラー、また、クオータニオンによるモーションブラーのみサポートされていますが、 インテル® oneAPI ベース & レンダリング・ツールキットを利用することでこれらの機能に加え、毛髪などの複雑な線や大幅にメモリー量を節約するマルチレベル・インスタンスなどの利用が可能となります。
インテル® OSPRay
スケーラブルで移植性の高い分散レンダリング API
現在の GPU レイトレーシング & レンダリングの能力ではジオメトリー、ボリューム、パス・トレーシング、化学的可視化の統合はサポートされていませんが、 インテル® oneAPI ベース & レンダリング・ツールキットを利用することで結合されたジオメトリーやビジュアライズ用のレンダラー、大規模データセットなどの利用が可能となります。またインテル® OSPRay は CPU をサポートしています。
インテル® Open Image Denoise
AI によって高速化されたデノイザーが優れたビジュアル品質を実現
現在の GPU レイトレーシング & レンダリングの能力ではレイトレーシング用 AI Denoising フィルター (オフライン & インタラクティブ) や複数入力の機能バッファー (HDR/LDF カラー、アルベド、通常) のみサポートされていますが、 インテル® oneAPI ベース & レンダリング・ツールキットを利用することでこれらの機能に加え、簡単かつ安定した C++ API などの利用が可能となります。またインテル® Open Image Denoise ではほとんどの CPU で実行が可能です。
インテル® オープン・ボリューム・カーネル・ライブラリー
3D 空間データ処理のレンダリング & シミュレーション
現在の GPU レイトレーシング & レンダリングの能力では構造体や VDB (疎構造) のボリュームタイプのみサポートされていますが、 インテル® oneAPI ベース & レンダリング・ツールキットを利用することでこれらの機能に加え、球形構造体やアダプティブ・メッシュ細分化などへの対応が可能となります。またインテル® オープン・ボリューム・カーネル・ライブラリーには Ray-Based Interval interation などの API がすでに含まれています。
インテル® OpenSWR
ハイパフォーマンスでスケーラブルな OpenGL* 互換ラスタライザー