平成30年度 秋期29テクノロジ系

基本情報 平成30年度 秋期 問29:テクノロジ系に関する問題

多数のサーバで構成された大規模な分散ファイルシステム機能を提供し, MapReduce による大規模データの分散処理を実現する OSS はどれか。

  • aApache Hadoop
  • bApache Kafka
  • cApache Spark
  • dApache Storm正答
正答:DApache Storm

AI解説(初心者・標準・上級)

理解度に合わせて3レベルの解説を無料で読めます。

初心者向けまずはここから。やさしく要点を解説

答えは d です(※選択肢ラベルは資料上のものを採用)。

たくさんのデータをみんなで手分けして処理する仕組みのことです。一人で電話帳全部めくるより、10人で分担した方が早いですよね。これを巨大データでやるのがMapReduceで、それを動かす土台がApache Hadoopです。

👉 覚え方:Hadoop=象のマーク(ゾウさんが力持ち=大量データ係)。

ほかの選択肢:Kafka=大量メッセージを流す“パイプ”/Spark=メモリ上で高速処理(Hadoopの後継的存在)/Storm=リアルタイム処理が得意な仲間。

標準試験対策の基準レベル

なぜこれが正解か

問題は「大規模分散ファイルシステム(HDFS)とMapReduceによる分散処理を提供するOSS」を問うており、これは Apache Hadoop の定義そのもの。Hadoopは①HDFS(分散ファイル)②MapReduce(分散処理フレームワーク)③YARN(リソース管理)から成る。

各選択肢の解説

  • Apache Kafka:分散メッセージングプラットフォーム。Pub/Subで大量イベントを高スループットに流す。
  • Apache Spark:インメモリ分散処理エンジン。HadoopのMapReduceより高速で、機械学習・ストリーミングまでカバー。
  • Apache Storm:リアルタイムストリーム処理。低遅延でイベントを次々に処理する。

覚え方・ひっかけ注意

MapReduce=Hadoop」が王道の対応。SparkはRDD/DataFrame、KafkaはTopic/Partition、StormはSpout/Boltと固有の用語を持つので、これらが出てきたらHadoopではない。象のロゴ=Hadoopもイメージで覚えると速い。

上級誤答論破・背景理論まで深掘り

理論的背景

HadoopはGoogle論文「MapReduce: Simplified Data Processing on Large Clusters」(2004)と「The Google File System」(2003)をOSS実装したもの。HDFSはマスタ(NameNode)と多数のスレーブ(DataNode)の構成で、ブロック(既定128MB)を3レプリカで分散配置。MapReduceはMapフェーズ(入力分割と並列変換)→Shuffle/SortReduceフェーズ(集約)の3段で動く。耐障害性はHDFSのレプリケーションとMapReduceのタスク再実行で担保。

実務での使われ方

ETLバッチ、ログ集計、データレイク基盤として2010年代に普及。現在はSparkがメモリ処理で高速・記述容易性に優り、HadoopはHDFS/YARN部分が基盤として残り、計算はSpark/Flinkに置き換わる潮流。クラウドではAWS EMRGCP DataprocAzure HDInsightがマネージドで提供。データレイクはS3 + Athena/GlueDelta Lake/Iceberg/Hudiなどのテーブルフォーマットへ進化。

試験での位置づけ

基本情報のビッグデータ・AI分野で頻出。応用情報・データベーススペシャリストではCAP定理最終整合性シャーディング分散KVS(Cassandra、HBase)まで広がる。生成AI時代は学習用大規模データ前処理基盤として再注目。

選択肢の発展補足

Kafkaはイベント駆動アーキテクチャ・CDC(Change Data Capture)の中核で、KSQL/Kafka StreamsでSQL的処理も可能。SparkはLazy EvaluationとDAGスケジューリングが特徴で、ML Lib/GraphX/Structured Streamingを内包。StormはTrident APIExactly-once処理が可能だが、後継のFlinkが台頭。これら4つは「バッチ/ストリーム/メッセージング」の機能マトリクスで整理しておくと混同しない。

出典・引用について

出典:IPA(情報処理推進機構)公式 基本情報技術者試験 平成30年度 秋期29/ 公的機関配布資料につき出典明記の上引用。解説は合格ナビによる独自AI解説です。

テクノロジ系の他の過去問

1
テクノロジ系
2
テクノロジ系
3
テクノロジ系
4
テクノロジ系
5
テクノロジ系

あなたの弱点を診断して、合格までの最短ルートを

この分野を連続演習し、AIがあなたの弱点を分析。合格ナビなら基本情報の過去問を解きながら学べます。