ビッグデータとは?定義から事例、問題点を分かりやすく徹底解説

ビッグデータとは? 活用例・問題点など徹底解説

ビッグデータって結局何なのか良く分からない…
何に活用されていて、どんな事例がある?
ビッグデータの問題点を知っておきたい

こんにちは。文系出身で現役8年目エンジニアの佐藤です。

皆さんは「ビッグデータ」について、どんなものか説明できますか? 調べてみても、なんだか良く分からないなあ……と感じている方も多いのではないでしょうか。

この記事では「ビッグデータとは何か?」を、誰にとっても分かりやすい言葉と身近な例で解説していきます。また、ビッグデータの問題点、ビッグデータを扱うお仕事の紹介もしていきますのでぜひ最後までご覧ください。

それではさっそく「ビッグデータの定義」から見ていきましょう。

ビッグデータとは?

画像:Shutterstock

この章では、ビッグデータの定義とどんなものがビッグデータと呼ばれるのかを解説していきます。

ビッグデータの定義

ビッグデータという名前から「大きい?多い?データなのかな?」と予想がつくかと思いますが、ビッグデータは単に大きいデータというだけではないんです。

ビッグデータの特徴には「4つのV」という要素があり、このVが含まれているものを「ビッグデータ」と呼んでいます。

  • Volume 容量

ビッグというくらいですから、容量の巨大さが特徴の一つです。現在の基準は数テラバイトから数ペタバイト程度のデータ量のものを指すようです。

  • Variety 種類

構造化データ(CSVやDBに格納できるデータ)以外にもデータには種類があります。ビッグデータには音声、動画、画像、センサ情報などのありとあらゆる形式でのデータが含まれているという特徴があります。

  • Velocity 頻度・スピード

交通系ICカードのデータ、SNSなど、リアルタイムで高速に増え続けるデータが格納されているという特徴もあります。

  • Value 価値

上記で紹介した3つの特徴だけでビッグデータといえるという訳ではありません。上記の特徴を持ち、分析することで経済的価値が生み出せるデータのことを「ビッグデータ」と呼んでいます。

簡単にまとめると「分析により経済的価値を生みだせる、あらゆる形式で増え続ける大量のデータ」がビッグデータです。

何となく概要がつかめたところで、ビッグデータの例を見ていきましょう。

ビッグデータの例

ビッグデータは大きく4つのジャンルに分かれています。

オープンデータ

オープンデータは、国や自治体などが所有している公共情報です。官民データとも呼ばれています。

2016年12月に施行された「官民データ活用推進基本法」に基づいて、ビジネスに生かす目的で開示を進めています。

このデータは、総務省が運営しているデータカタログサイトで簡単に入手することができるんです。活用例や、日本でのビッグデータの取り組みなども紹介されているので、興味のある方はぜひご覧ください。

ノウハウを構造化したデータ

企業・農業などのビジネスに関するノウハウをデジタル化した情報で、「知のデジタル化」と呼ばれています。

仕事に関するノウハウは人に依存していることが多いですが、それをデジタル情報化して誰でも確認できるようにしようという取り組みが行われています。

M2Mのストリーミングデータ

M2M(Machine to Machine)は、機械と機械がネットワークを使い直接情報の交換を行うことです。ストリーミングとは情報を取得しつつ、同時に再生(見る)する技術のことをいいます。

例えば、工場のいろいろな機器に取り付けられたセンサーからのリアルタイムなデータ、自動販売機の売上・在庫データがこのカテゴリに含まれます。

「知のデジタル化」と「M2M」を合わせて「産業データ」とも呼ばれています。

パーソナルデータ

最後に、個人の情報があります。名前などはもちろん、行動履歴などが代表的な例です。
特定の個人を判別できないよう加工された「匿名加工情報」もパーソナルデータに含まれます。

 

次に、どうしてビッグデータが急に普及してきたのか簡単に見ていきましょう。

ビッグデータが急に普及した理由

画像:Shutterstock

ビッグデータが急に普及した理由には、インターネットの普及・あらゆるものがデータ化できる時代になったという要素もありますが「Hadoop(ハドゥープ)」と呼ばれる技術が登場したためと言われています。

Hadoopとは簡単に言うと、一台のパソコンではできないような大量のデータを使った計算・処理をたくさんのパソコンに分散させて処理させる技術です。

100問の問題を一人で解くより、10人で同時に10個ずつ解けばすぐ終わりますよね。それと同じことをパソコン同士でもさせられるようになったんです。

これにより、ビッグデータを取り扱うために高額な機器を買わなくても済むようになりました。気軽にビッグデータを利用することができるようになったため、急速に普及しているんですね。

ビッグデータの概要について解説しました。次に、身近な活用事例を見て理解を深めていきましょう。

ビッグデータの身近な活用事例

この章ではビッグデータを活用した身近な例を紹介していきます。

ソフトバンク

画像:Shutterstock

ソフトバンクでは、顧客の通信・電波状況、電波が悪くなった時間、場所などのデータを取集・分析し電波状況の改善に取り組みました。何とそのデータはひと月で1.9億件にもなるとか……そのビッグデータを分析することで、次に建てる電波塔の場所を決定していったんです。

結果、電波状況は劇的に改善されました。つながりやすさNo1と宣伝している時もありましたよね。

スシロー

中とろより価値あるITを。あきんどスシローのクラウド活用術 (AWS Summit Tokyo 2013 )

スシローでもビッグデータが使われているんです。一体どこに? と思いますよね、実はお寿司が乗っている皿の中に情報を取得するためのICチップを入れているんです。

レーンを回っていく中で、「どの寿司」が「いつ」「どれくらい」食べられたのかというデータを自動で収集していきます。このデータとその日の天候や客層などを組み合わせることで、寿司ネタ毎の需要を予測していったんです。その予測に基づいて仕入れやレーンに流す量を調整しました。

結果、スシローでは食材の廃棄量が大幅に減少しました。ビッグデータを分析することで、無駄を無くした活用例です。

また、寿司がレーンをどれくらい回ったのかという距離も測定しました。一定の距離を回った=鮮度が落ちてきたと判断して、自動でレーンから外れるようにしたんです。つまり、店員さんの負担も軽減することに成功したんですね。

ホンダ

画像:Shutterstock

ホンダでは、会員が搭載しているカーナビから走行データを収集・分析することで渋滞改善に取り組みました。その過程で、注意が必要な道路を特定することができました。

会員からの走行データは毎月2億Kmになるようです、この中で急ブレーキを踏んだ場面や渋滞になりやすい時間、場所を分析しました。

この分析結果から、事故が起きやすい道路へ標識の追加などを行い事故を減らしたという実績があります。

自治体や観光地

画像:Shutterstock

企業以外にも自治体や観光地がビッグデータを使った取り組みをしています。

石川県羽咋市では、衛星から水田の写真を撮影し集めました。これを分析することで、タンパク質がちょうどよく含まれるお米を判断したり、次の年のための施肥量を予測することができました。結果、研究したお米はブランド米として販売されるようになり、収益が増加しました。

また、城ケ崎温泉では温泉街にてスマホやICカードで決済できる仕組みを導入し、顧客に関するデータを収集しました。どんなお客さんがいつ、何人で、どんなものを買っているのか分析することで、的確な宣伝の仕方や効果的なイベントを企画することに成功しました。この結果、収益が改善したということなんです。

このように、ビッグデータは身近なところで使われ始めています。

メリットや活用方法が無限にありそうなビッグデータですが、まだまだ日本では発展途上な面もあります。ビッグデータの問題点も確認していきましょう。

ビッグデータの問題点

画像:Shutterstock

皆さんが一番心配しているのは

自分のデータが流出したり、勝手に売られたらどうしよう……

という事かと思います。日本では、まだデータの売買に関して国民が慣れておらず「プライバシーの侵害なのでは?」と反応してしまうこともしばしばです。
日本ではビッグデータに関する教育や情報発信がまだまだ少ないというのが一つの問題点なんです。また、データを集める事に執着してしまい適切に分析できていないという面も問題点としてあげられます。

さらに日本では、ビッグデータを扱える知識を持った研究者・技術者が全く足りていないという発表もされています。ビッグデータがあっても、分析ができなければ何らかの結果は得られません。

このように、日本ではビッグデータに関してまだまだ発展途上な面も多くあります。今後どのように発展していくのか、更に活用していくにはどうしたらよいのか考えるためにもビッグデータに関する基礎的な知識は持っていたいですよね。

最後に、先程不足していると言われていたビッグデータを扱うことができるプロについて紹介していきます。

ビッグデータを扱う仕事

画像:Shutterstock

この章では、ビッグデータを扱う仕事について紹介します。

データサイエンティスト

ビッグデータを「分析」するプロはデータサイエンティストと呼ばれています。日本ではまだデータサイエンティストの定義があいまいな部分があり、職業として正しく認知されていないという現状があります。

データサイエンティストは、機械学習などを使いビッグデータを分析します。そこから何らかの結果をレポートにまとめ、場合によっては次のアクションを企業に提案するというお仕事をしています。

データサイエンティストを詳しく紹介した記事がありますので、気になる!という方はこちらをご覧ください。

機械学習エンジニア

機械学習AI(人工知能)を支える一つの技術です。
機械学習エンジニアは、「AI(人工知能)」「ビッグデータ」「ディープラーニング」の技術を活かして、データ分析を自動で行ってくれるようなシステムを作成。新サービスの開発や現サービスへの結びつけを行うのが主なお仕事です。

データサイエンティストと似ていますが、ビッグデータ「分析」のプロとビッグデータ分析システムの「開発」のプロという分類で違いがあります。

機械学習エンジニアについても詳しい解説記事がありますので、興味がある方はぜひこちらもご覧ください。

まとめ

最近よく聞く「ビッグデータ」について解説しました。

結局何なのか良く分からない、という悩みが少しでも解決できたとしたら筆者も嬉しいです。

それでは、次の解説で!

LINEで送る
Pocket

最短でエンジニアを目指すなら侍エンジニア塾

cta_under_bnr

侍エンジニア塾は業界で初めてマンツーマンレッスンを始めたプログラミングスクールです。これまでの指導実績は16,000名を超え、未経験から数多くのエンジニアを輩出しています。

あなたの目的に合わせてカリキュラムを作成し、現役エンジニア講師が専属であなたの学習をサポートするため効率よく学習を進めることができますよ。

無理な勧誘などは一切ありません。まずは無料体験レッスンを受講ください。

無料体験レッスンの詳細はこちら

書いた人

佐藤

佐藤

文系大学出身、なんとか自力で頑張りプログラマー歴今年で8年目。
自力で頑張って勉強した経験を生かし、読者の皆様に分かりやすく親しみやすい記事を書けるよう日々邁進中です。
出来る言語はC#,VB,Java,Delphiなどなど、幅広く触っています。

おすすめコンテンツ

あなたにぴったりなプログラミング学習プランを無料で診断!

プログラミング学習の効率を劇的に上げる学習メソッドを解説