情報処理基礎
演習の内容や課題について
第13回 (7月12日)
数理・データサイエンス・AIによる実社会における各種データの基本的な利活用事例 1
近年、ビッグデータやクラウドコンピューティング、AI、データサイエンスといった言葉を良く目にするようになってきた。
政府も、AIのできる・データサイエンスのわかる人材育成に力を入れはじめており、テクノロジーを活用することのできる人材の需要が急増している。
・データサイエンスとは
データサイエンスとは、得られたデータから価値を見出し、その価値を研究活動やビジネスにおける課題解決や意思決定につなげていくための考え方・ツールである。
データサイエンスを使いこなす専門家をデータサイエンティストと呼び、データサイエンティストには次の3つの能力が必要であるとされる。
@ 研究やビジネスに存在する課題を見つけ出し把握する能力
A 課題に対して適切なデータを取得し、それを解析する能力
B 解決への方策を見つけ出し、その方法を(継続的に)利用可能な形へと変容させる能力
・データ量の増加
情報端末やWebの発展に伴い、ビッグデータやデータサイエンス、IoT(Internet of Things)といった言葉が浸透してきた。
それと同時に得られるデータ量が増加してきている。データを収集する手段が増えたこと、データを処理するマシン性能の向上やクラウドといった技術の発展が大きな要因である。
その結果、多くの人々がデータを手軽に扱えるようになった。
スマートウォッチの登場により、活動量や心拍数、睡眠記録などの身体データをデバイスから簡単、高速、大量に収集できるようになったのが一例である。
・データの種類
日常で扱われているデータには、(Excelのような)テーブルデータ、文書等のテキストデータ、画像データ、システムの記録を残すログデータ、音声データなどがある。
・データの集計・可視化・予測
IoTやクラウドの発展によって様々なデータを収集できるようになったが、得られた(大量の)データをしっかりと集計することも重要である。
「平均」といった観点で見ることもあれば、「標準偏差」が重要な場面もある。
あるいは、「最大値」や「最小値」、「中央値」や「最頻値」などがキーになる場面もあるだろう。
場面ごとに適切にデータを活用していくためには統計学の知識が必要不可欠である。
データの特徴を数値(統計量)で確認するよりも、グラフなどを用いて可視化したほうが理解しやすく、データを分析しやすい場合がある。
必要な情報を正確に・瞬時に伝えるためにはデータ可視化がとても重要である。
また、可視化したデータは、現在までの情報を見ているだけのものである。与えられた過去の実績データの傾向に基づいて、
未来のデータを予測できる技術は機械学習と呼ばれ、実社会に続々と取り入れられている。
・データサイエンスの需要
近年、多くの企業がデータサイエンス、AI、デジタルトランスフォーメーション(DX)といったキーワードで人材育成に乗り出している。
AIやDXの内容を見ると、データサイエンスが部分的に使われており、どの企業もデータサイエンスのスキルを持つ人材を求めていると言い換えられる。
必ずしも数学やプログラミングが得意である必要はなく、最近では、支援ツールもどんどんと開発されているので、
高度な専門知識を持っていなくてもそれらのツールを利用してデータサイエンスを行えるようになってきた。
データサイエンスは、業務の効率化・自動化や意思決定の迅速化といった様々な場面で活用されており、無くてはならないスキルになりつつある。
数理・データサイエンス教育強化拠点コンソーシアム モデルカリキュラム対応教材
滋賀大学MOOC「大学生のためのデータサイエンス(T)」より
データサイエンスの役割 (1)
https://www.youtube.com/watch?v=3ugrLQHSXC0
データサイエンスの役割 (2)
https://www.youtube.com/watch?v=VdjziOqewpk
データの取得・管理 @データの収集と保存
https://www.youtube.com/watch?v=cMkC6vrGBqQ
データの取得・管理 Aデータの管理
https://www.youtube.com/watch?v=xI8X1PAcfjg
データの入手方法
https://www.youtube.com/watch?v=5j1lwW7F70k
データの分析
https://www.youtube.com/watch?v=8dsqWrKlYMM
第13回課題
youtubeの動画教材に登場した例以外に
身の回りでデータサイエンスが用いられている事例を一つ示し,その例では
・どの様な種類のデータが対象で
・どの様な分析が行われており(可能であれば分析の過程が分かる図やグラフも示し)
・分析結果がどのように活用されているか
を説明せよ.
上記をwordファイルにまとめ,ファイル名を半角文字で「学籍番号-DS.docx」として
メールに添付して提出すること.
件名は、"DS 学籍番号"とすること。(例:DS SB21M999)
第14回 (7月19日)
数理・データサイエンス・AIによる実社会における各種データの基本的な利活用事例 2
・社会で活用されているデータ
調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなどが、実社会で活用されている例としてマーケティングリサーチを見てみる。
〜マーケティングリサーチ〜
企画や効果検証に対するデータを様々な手法を用いて収集・分析することを言い、収集・分析するデータから、その実態構造の把握・将来的構造の創造材料などを得ることができる。
よく似た言葉に「市場調査(マーケットリサーチ)」があるが、「市場調査」がこれまでの商品・サービスの構造をデータで把握することを目的とするのに対し、
「マーケティングリサーチ」は、(将来的なニーズ探索など)これからの商品・サービスの構造を明らかにすることを目的とすることが一般的である。
マーケティングリサーチには定量調査と定性調査の2種類があり、それぞれの調査で収集されるデータは、”数値”などで示される「量的データ」と、
”言葉・行動・状況”などで示される「質的(定性)データ」である。
数理・データサイエンス教育強化拠点コンソーシアム モデルカリキュラム対応教材
滋賀大学MOOC「大学生のためのデータサイエンス(T)」より
マーケティングリサーチ 概要編
https://www.youtube.com/watch?v=WINh_UHlNiw
マーケティングリサーチ 企画編
https://www.youtube.com/watch?v=MLSMQC4ioUk
マーケティングリサーチ 事例編
https://www.youtube.com/watch?v=fpMjUhuN-B4
・データ・AI利活用のための技術
収集されたデータは、統計的な手法によって分析されるだけではなく、AIを使った機械学習により、そこから新たな価値を見出すことも盛んに行われている。
〜AI・機械学習・ディープラーニング〜
AI:
Artificial Intelligenceの略で人工知能のことである。人間の知能を人工的に機械で模倣しようとしたことから名付けられた。
機械学習:
取得したデータから、未知のデータに対しても適用可能な規則やパターンを抽出したり、未知のデータを分類・予測したりすることを言う。数値予測や画像分類などが該当する。
ディープラーニング:
機械学習には、回帰分析や決定木分析、SVMといった様々な手法があるが、ディープラーニングとはそのうちの1手法のことである。
AIを搭載したアプリが身近な存在になっているが、その多くではディープラーニングが応用されている。
・機械学習
機械学習には、教師あり学習、教師なし学習、強化学習の3つに分けることができる。
教師あり学習:
モデルに答えとなるデータ(目標値)を一緒に含めて学習させる方法のことで、数値を予測する回帰と、カテゴリを予測する分類がある。
 |
 |
回帰:データの当てはまる線を求める |
分類:データを分ける境界線を求める |
教師なし学習:
答えの無い学習方法で、与えられたデータの特徴や法則を抽出するものである。
特徴の類似したデータをグルーピングするクラスタリング、データから重要な情報を抽出し変数の数(次元)を減らす次元削減がある。
 |
 |
クラスタリング |
次元削減 |
強化学習:
入力データも目標値もなく、自らが試行錯誤を繰り返し最適な行動を学習する方法で、掃除ロボット(○Robot社のル○バなど)や世界トップ棋士に勝利した囲碁AIなどでおなじみ。
数理・データサイエンス教育強化拠点コンソーシアム モデルカリキュラム対応教材
滋賀大学MOOC「大学生のためのデータサイエンス(T)」より
機械学習を使ったテキストからの性格推定
https://www.youtube.com/watch?v=ukOjKB8xg3c
機械学習の先進的な事例 マーケティング
https://www.youtube.com/watch?v=gwfC8oYdbZA
第14回課題
新たな分野にAIを導入することを考えてみる.
教師あり学習,教師なし学習,強化学習について,それぞれの学習方法が活かせると思われる事例を考え
具体的にどの様な活用法が可能であるか説明せよ.
上記をwordファイルにまとめ,ファイル名を半角文字で「学籍番号-AI.docx」として
メールに添付して提出すること.
件名は、"AI 学籍番号"とすること。(例:AI SB21M999)
最終更新日:20210628