logo

NJP

ServiceNow Document Intelligence:日本語OCRデータ抽出の対応

New article articles in ServiceNow Community · Apr 23, 2025 · article

​ServiceNow Document Intelligence(DocIntel)は、AIとOCR(光学式文字認識)技術を組み合わせて、非構造化ドキュメントから構造化データを抽出するソリューションです。​この機能は、請求書、注文書、本人確認書類など、さまざまな日本語の印刷物から情報を抽出し、業務プロセスを自動化するのに役立ちます。​


Document Intelligenceの主な機能

1. 日本語OCRのサポート

DocIntelは、漢字、ひらがな、カタカナを含む日本語の印刷テキストを認識し、データを抽出できます。​これにより、日本語の請求書や申請書などからの情報抽出が可能になります。

2. AIとOCRの統合

単なる文字認識にとどまらず、AIモデルが文脈を理解し、必要な情報を正確に抽出します。​これにより、フォーマットが異なるドキュメントでも高精度なデータ抽出が可能です。

3. カスタマイズ可能なフィールド設定

ユーザーは、抽出したいデータフィールド(例:請求書番号、金額、日付など)を定義し、モデルをトレーニングできます。​これにより、特定の業務ニーズに合わせたデータ抽出が実現します。

4. ワークフローとの統合

抽出されたデータは、ServiceNowの各種テーブル(例:調達、人事、顧客サービス管理)と連携し、自動的なワークフローをトリガーできます。​


導入手順

1. ユースケースの作成

「Document Intelligence > Document Data Extraction Administration > Use Cases」に移動し、新しいユースケースを作成します。

Palash_Sarkar_0-1745311163461.png

2.フィールドの定義

抽出したいデータフィールドを定義します。フィールドには、単一フィールド、テーブル、チェックボックスリストなどがあります。

Palash_Sarkar_2-1745312063843.png

3.1 ドキュメントタスクの作成

ユースケース内で「Document Tasks」を作成し、処理したい日本語ドキュメントをアップロードします。

Palash_Sarkar_3-1745312164431.png

3.2 AIモデルトレーニング

ドキュメントインテリジェンス (DocIntel) ワークスペースで日本語ドキュメントのトレーニングを行います。

Palash_Sarkar_0-1745394894459.png

3.3 データ抽出モードの構成

ドキュメントタスクでのデータ抽出方法とタスクの処理方法を決定します。

Palash_Sarkar_2-1745397893811.png

4. ワークフローとの統合

抽出されたデータをServiceNowの対象テーブルと連携し、自動化された業務プロセスを構築します。

Palash_Sarkar_1-1745395064882.png

注意点とベストプラクティス

  • 多様なドキュメントでのトレーニング
    モデルの精度を高めるために、異なるフォーマットの日本語ドキュメントを使用してトレーニングを行うことが推奨されます。​
  • 必要なフィールドのみを抽出
    業務に必要なデータフィールドのみを定義し、不要な情報の抽出を避けることで、モデルの効率性が向上します。​
  • 定期的なモデルの評価と更新
    業務プロセスの変更や新しいドキュメント形式への対応のため、モデルの定期的な評価と再トレーニングが重要です。​

ServiceNow Document Intelligenceの日本語OCR対応により、日本語ドキュメントのデジタル化と業務プロセスの自動化が一層進化しました。​この機能を活用することで、データ入力の効率化、エラーの削減、業務の迅速化が期待できます。​

詳細な情報や導入ガイドについては、ServiceNow公式ドキュメントをご参照ください。

View original source

https://www.servicenow.com/community/japan-blog/servicenow-document-intelligence-%E6%97%A5%E6%9C%AC%E8%AA%9Eocr%E3%83%87%E3%83%BC%E3%82%BF%E6%8A%BD%E5%87%BA%E3%81%AE%E5%AF%BE%E5%BF%9C/ba-p/3243887