令和7年度81テクノロジ系

ITパスポート 令和7年度 問81:technology_elementに関する問題

イメージスキャナーで読み取った紙の書類の画像から,印刷文字や手書きの文字を読み取り,テキストデータに変換する技術を何と呼ぶか。

  • aCCD
  • bDVI
  • cGPU
  • dOCR正答
正答:DOCR

AI解説(初心者・標準・上級)

理解度に合わせて3レベルの解説を無料で読めます。

初心者向けまずはここから。やさしく要点を解説

答えは d「OCR」 です。

紙に書いた文字を、人がキーボードで打ち直さなくても、画像を取り込むだけでパソコンが「これは“あ”だな」と読み取って文字データにしてくれる技術です。

たとえばスマホのカメラを名刺にかざすと、名前や電話番号が自動で入力されますよね。あれと同じ仲間です。

👉 覚え方:OCR=「Optical(光で)Character(文字)Recognition(認識)」=“目で見て文字を読む”。

ほかの選択肢:a CCD=カメラやスキャナーの「目」になる部品/b DVI=映像をモニターに送るケーブルの規格/c GPU=画像やAIの計算が得意な部品。

標準試験対策の基準レベル

なぜこれが正解か

正解は d。OCR(Optical Character Recognition、光学文字認識)は、スキャナーやカメラで取り込んだ画像内の印刷文字・手書き文字を解析し、編集可能なテキストデータに変換する技術。紙の帳票・名刺・書籍の電子化(ペーパーレス化)で使われる。

各選択肢の解説

  • a CCD:光を電気信号に変える撮像素子(センサー)。スキャナーやデジカメの「目」で、文字認識そのものはしない。
  • b DVI:ディスプレイへ映像信号を送るインタフェース規格。
  • c GPU:画像処理や並列計算に特化した処理装置。AI計算にも使うが文字認識の名称ではない。

覚え方・ひっかけ注意

CCDは「読み取る装置(ハード)」、OCRは「文字に変換する技術(処理)」と役割を分けて覚える。OCRは“Character(文字)”が入っているのが決め手。

上級誤答論破・背景理論まで深掘り

理論的背景

OCR(Optical Character Recognition:光学的文字認識)は、スキャナー・カメラ・スマートフォンで撮影した文書画像から文字を自動的に読み取り、編集可能なテキストデータに変換する技術である。正解はdのOCRである。

OCRの技術的発展を詳述する。第1世代OCR(テンプレートマッチング):文字の形状を事前に登録した参照パターンとの一致率で判定する手法。印字フォントに特化して高精度だが、手書き文字やフォントのバリエーションに弱い。第2世代OCR(機械学習・SVM/HMM):特徴量抽出と統計的分類器を組み合わせた手法。手書き文字の認識精度が向上した。第3世代OCR(ディープラーニング):CNNとLSTM/Transformerを組み合わせた現代のOCR。CRNN(Convolutional Recurrent Neural Network)やAttention Mechanismにより、多様なフォント・手書き・複雑なレイアウトに対応。Google Document AI・Amazon Textract・Azure Form Recognizer・Tesseract OCR(OSS)が代表的な実装である。

画像からテキストへの変換プロセス:前処理(傾き補正・ノイズ除去・二値化・コントラスト調整)→レイアウト解析(段組・表・グラフの領域分離)→文字認識(各文字領域のOCR)→後処理(言語モデルによるスペル補正・意味的整合性チェック)という4段階を経る。

実務での使われ方

OCRは現在、ドキュメントDX(デジタルトランスフォーメーション)の中核技術として急速に普及している。主要な実務応用を整理する。

請求書・領収書の自動処理(IDP:Intelligent Document Processing):紙の請求書をスキャン→OCRでテキスト化→AI(NLPモデル)で金額・日付・取引先を構造化データとして抽出→ERP・会計システムへ自動入力。freee・マネーフォワード・SAP等のクラウド会計サービスがこの機能を標準搭載している。医療分野:カルテのデジタル化・処方箋の自動読み取り・医療文書の構造化データ変換。金融分野:本人確認書類(免許証・パスポート)の自動読み取りeKYC(電子本人確認)。物流・在庫管理:荷票・ラベルのバーコード・QRコードと組み合わせた在庫トラッキング。

試験での位置づけ

OCRはITパスポートのテクノロジ系「技術要素・入力デバイス」分野で出題される用語であり、CCD(イメージセンサー)・DVI(映像出力規格)・GPU(描画プロセッサ)との区別を問う本問のような形式が典型的である。ITパスポートシラバスVer.6.0では「デジタル化・DX」の文脈でOCRの重要性が強調されており、RPAとの組み合わせ(紙の申請書→OCR→RPA→基幹システム入力の自動化フロー)での出題も増えている。「イメージスキャナーで読み取った画像からテキストに変換」という定義を正確に押さえることが正答の鍵である。

基本情報技術者試験では、OCRの技術的仕組み(パターンマッチング vs 機械学習ベース)・OCRの限界(手書き文字の認識精度・複雑なレイアウトの処理)・RPA(Robotic Process Automation)とOCRの組み合わせ・IDP(Intelligent Document Processing)の概念まで問われる可能性がある。

選択肢の発展補足

選択肢aのCCD(Charge-Coupled Device:電荷結合素子)はイメージセンサーの一種であり、デジタルカメラ・スキャナーの光センサーとして使われる半導体デバイスである。CCDセンサーは光をアナログ電荷として蓄積・転送してAD変換するもので、現在はより低コスト・高性能のCMOS(Complementary Metal-Oxide-Semiconductor)センサーに多くの分野で置き換えられている。CCDはスキャナーが「画像を読み取る物理的な入力センサー」であり、OCRはその読み取った画像データから文字を認識する「ソフトウェア的な処理」という上下関係にある。選択肢bのDVI(Digital Visual Interface)はコンピュータとディスプレイを接続する映像出力規格であり、HDMI・DisplayPortに置き換えられつつあるが、古いモニター・プロジェクターとの接続に今も使われる。デジタル信号(DVI-D)・アナログ信号(DVI-A)・デジタルとアナログ両用(DVI-I)の3種類がある。選択肢cのGPUはbatch_32でも扱ったが、描画処理専用プロセッサであり、OCRの文字認識処理(CPUまたはGPU上で動作するAIモデル)とは概念が異なる。

出典・引用について

出典:IPA(情報処理推進機構)公式 ITパスポート試験 令和7年度81/ 公的機関配布資料につき出典明記の上引用。解説は合格ナビによる独自AI解説です。

テクノロジ系の他の過去問

55
security
56
database
57
database
58
technology_element
59
network

あなたの弱点を診断して、合格までの最短ルートを

この分野を連続演習し、AIがあなたの弱点を分析。合格ナビならITパスポートの過去問を解きながら学べます。