令和7年度問81テクノロジ系

ITパスポート令和7年度問81：technology_elementに関する問題

イメージスキャナーで読み取った紙の書類の画像から，印刷文字や手書きの文字を読み取り，テキストデータに変換する技術を何と呼ぶか。

aCCD
bDVI
cGPU
dOCR正答

正答：DOCR

AI解説（初心者・標準・上級）

理解度に合わせて3レベルの解説を無料で読めます。

初心者向けまずはここから。やさしく要点を解説

答えは d「OCR」 です。

紙に書いた文字を、人がキーボードで打ち直さなくても、画像を取り込むだけでパソコンが「これは“あ”だな」と読み取って文字データにしてくれる技術です。

たとえばスマホのカメラを名刺にかざすと、名前や電話番号が自動で入力されますよね。あれと同じ仲間です。

👉 覚え方：OCR＝「Optical（光で）Character（文字）Recognition（認識）」＝“目で見て文字を読む”。

ほかの選択肢：a CCD＝カメラやスキャナーの「目」になる部品／b DVI＝映像をモニターに送るケーブルの規格／c GPU＝画像やAIの計算が得意な部品。

標準試験対策の基準レベル

なぜこれが正解か

正解は d。OCR（Optical Character Recognition、光学文字認識）は、スキャナーやカメラで取り込んだ画像内の印刷文字・手書き文字を解析し、編集可能なテキストデータに変換する技術。紙の帳票・名刺・書籍の電子化（ペーパーレス化）で使われる。

各選択肢の解説

a CCD：光を電気信号に変える撮像素子（センサー）。スキャナーやデジカメの「目」で、文字認識そのものはしない。
b DVI：ディスプレイへ映像信号を送るインタフェース規格。
c GPU：画像処理や並列計算に特化した処理装置。AI計算にも使うが文字認識の名称ではない。

覚え方・ひっかけ注意

CCDは「読み取る装置（ハード）」、OCRは「文字に変換する技術（処理）」と役割を分けて覚える。OCRは“Character（文字）”が入っているのが決め手。

上級誤答論破・背景理論まで深掘り

理論的背景

OCR（Optical Character Recognition：光学的文字認識）は、スキャナー・カメラ・スマートフォンで撮影した文書画像から文字を自動的に読み取り、編集可能なテキストデータに変換する技術である。正解はdのOCRである。

OCRの技術的発展を詳述する。第1世代OCR（テンプレートマッチング）：文字の形状を事前に登録した参照パターンとの一致率で判定する手法。印字フォントに特化して高精度だが、手書き文字やフォントのバリエーションに弱い。第2世代OCR（機械学習・SVM/HMM）：特徴量抽出と統計的分類器を組み合わせた手法。手書き文字の認識精度が向上した。第3世代OCR（ディープラーニング）：CNNとLSTM/Transformerを組み合わせた現代のOCR。CRNN（Convolutional Recurrent Neural Network）やAttention Mechanismにより、多様なフォント・手書き・複雑なレイアウトに対応。Google Document AI・Amazon Textract・Azure Form Recognizer・Tesseract OCR（OSS）が代表的な実装である。

画像からテキストへの変換プロセス：前処理（傾き補正・ノイズ除去・二値化・コントラスト調整）→レイアウト解析（段組・表・グラフの領域分離）→文字認識（各文字領域のOCR）→後処理（言語モデルによるスペル補正・意味的整合性チェック）という4段階を経る。

実務での使われ方

OCRは現在、ドキュメントDX（デジタルトランスフォーメーション）の中核技術として急速に普及している。主要な実務応用を整理する。

請求書・領収書の自動処理（IDP：Intelligent Document Processing）：紙の請求書をスキャン→OCRでテキスト化→AI（NLPモデル）で金額・日付・取引先を構造化データとして抽出→ERP・会計システムへ自動入力。freee・マネーフォワード・SAP等のクラウド会計サービスがこの機能を標準搭載している。医療分野：カルテのデジタル化・処方箋の自動読み取り・医療文書の構造化データ変換。金融分野：本人確認書類（免許証・パスポート）の自動読み取りeKYC（電子本人確認）。物流・在庫管理：荷票・ラベルのバーコード・QRコードと組み合わせた在庫トラッキング。

試験での位置づけ

OCRはITパスポートのテクノロジ系「技術要素・入力デバイス」分野で出題される用語であり、CCD（イメージセンサー）・DVI（映像出力規格）・GPU（描画プロセッサ）との区別を問う本問のような形式が典型的である。ITパスポートシラバスVer.6.0では「デジタル化・DX」の文脈でOCRの重要性が強調されており、RPAとの組み合わせ（紙の申請書→OCR→RPA→基幹システム入力の自動化フロー）での出題も増えている。「イメージスキャナーで読み取った画像からテキストに変換」という定義を正確に押さえることが正答の鍵である。

基本情報技術者試験では、OCRの技術的仕組み（パターンマッチング vs 機械学習ベース）・OCRの限界（手書き文字の認識精度・複雑なレイアウトの処理）・RPA（Robotic Process Automation）とOCRの組み合わせ・IDP（Intelligent Document Processing）の概念まで問われる可能性がある。

選択肢の発展補足

選択肢aのCCD（Charge-Coupled Device：電荷結合素子）はイメージセンサーの一種であり、デジタルカメラ・スキャナーの光センサーとして使われる半導体デバイスである。CCDセンサーは光をアナログ電荷として蓄積・転送してAD変換するもので、現在はより低コスト・高性能のCMOS（Complementary Metal-Oxide-Semiconductor）センサーに多くの分野で置き換えられている。CCDはスキャナーが「画像を読み取る物理的な入力センサー」であり、OCRはその読み取った画像データから文字を認識する「ソフトウェア的な処理」という上下関係にある。選択肢bのDVI（Digital Visual Interface）はコンピュータとディスプレイを接続する映像出力規格であり、HDMI・DisplayPortに置き換えられつつあるが、古いモニター・プロジェクターとの接続に今も使われる。デジタル信号（DVI-D）・アナログ信号（DVI-A）・デジタルとアナログ両用（DVI-I）の3種類がある。選択肢cのGPUはbatch_32でも扱ったが、描画処理専用プロセッサであり、OCRの文字認識処理（CPUまたはGPU上で動作するAIモデル）とは概念が異なる。

出典・引用について

出典：IPA（情報処理推進機構）公式 ITパスポート試験令和7年度問81／公的機関配布資料につき出典明記の上引用。解説は合格ナビによる独自AI解説です。