シラバス参照

講義概要/Course Information
2024/07/27 現在

科目基礎情報/General Information
授業科目名
/Course title (Japanese)
データサイエンティスト特論
英文授業科目名
/Course title (English)
Advanced Data Scientist
科目番号
/Code
開講年度
/Academic year
2017年度 開講年次
/Year offered
全学年
開講学期
/Semester(s) offered
後学期 開講コース・課程
/Faculty offering the course
博士前期課程、博士後期課程
授業の方法
/Teaching method
講義 単位数
/Credits
2
科目区分
/Category
大学院実践教育科目
開講類・専攻
/Cluster/Department
全専攻共通
担当教員名
/Lecturer(s)
田村 元紀
居室
/Office
東7号館205室
公開E-mail
/e-mail
tamura@uec.ac.jp
授業関連Webページ
/Course website
http://data-entrepreneur.com
更新日
/Last update
2017/09/28 14:12:33 更新状況
/Update status
公開中
/now open to public
講義情報/Course Description
主題および
達成目標(2,000文字以内)
/Themes and goals(up to 2,000 letters)
現在、情報技術革命が進む中にあって、センサの数が激増し、人類の計算キャパシティは幾何級数的に拡大している。また、ブロードバンド化に伴い、ネットワークの接続スピードは劇的に高まり、情報トラフィックも激増している。このような時代に求められるのは、人間を数字入力や情報処理の作業から開放するプロフェッショナル人材であり、「データの持つ力を解き放つ」ことが新しい時代におけるデータプロフェッショナル、すなわち「データサイエンティスト」のミッションである。データサイエンティストにもとめられるスキルセットは、ビジネス力、データサイエンス力、データエンジニアリング力である。
データサイエンティストの実際の業務内容や上記スキルセットについて、講義と具体的な課題解決演習を通じて理解することを目標とする。
前もって履修
しておくべき科目(1,000文字以内)
/Prerequisites(up to 1,000 letters)
大学数学、アルゴリズム、プログラミング、統計学、機械学習、データマイニング、データアントレプレナー実践論
前もって履修しておくこ
とが望ましい科目(1,000文字以内)
/Recommended prerequisites and preparation(up to 1,000 letters)
統計学、機械学習、データマイニング。Pythonに慣れていない方は自習が必須。冬休みには課題解決のための宿題がある。
教科書等(1,000文字以内)
/Course textbooks and materials(up to 1,000 letters)
テキストやデータはWebページ等からダウンロード。
授業内容と
その進め方(2,000文字以内)
/Course outline and weekly schedule(up to 2,000 letters)
ビッグデータ/IoTの担い手として”データサイエンティスト”という新しい職種に注目が集まるとともに、人材の不足が問題となっている。
本科目では、小売り業の実際の購買データを使って、ビジネス課題を解決するためのデータ分析とモデル作成を行う。講師はデータサイエンティスト協会所属企業の気鋭のデータサイエンティストが務める。
主担当講師は、金融エンジニアリング・グループの斉藤史朗上席コンサルタント、および原田慧副主任コンサルタント。補助講師として、データサイエンティスト数名がサポートする。
※”データサイエンティスト”の定義については、以下のプレスリリース参照
http://www.datascientist.or.jp/news/2014/pdf/1210.pdf

(1)(12/2 3限)ガイダンス:①分析する上での注意点、データや情報の取り扱いについてお話します。②データ提供会社におけるデータ活用の事例を、実際の最前線の現場にいる方にお話しいただきます。③データサイエンスとビジネス:この講義での目標、実際の仕事におけるデータサイエンスの役割などについて、お話します。
(2)(12/3 4限)①分析環境について。②Pythonについて。③CRISP-DMについて。④データ理解(Pythonを使った集計とデータの可視化(1)):提供いただいたデータを読み込んで集計します。Pandasと matplotlibを実践してもらいます。
(3)(12/3 5限)データ理解(Pythonを使った集計とデータの可視化(2)):集計したデータを可視化して、これから取り組むデータの姿を明らかにします。最後に各班で議論して、「こういうことをやってみたい」というテーマの方向性を決めてもらいます。
(4)(12/9 3限)サンプル分析(1)(A社のデータを使って、簡単なテーマを設定し、モデルを作ってみます。)。Scikit-learnの実習をしてもらいます。
(5)(12/9 4限)①サンプル分析(2)(A社のデータを使って、簡単なテーマを設定し、モデルと作ってみます。)。Scikit-learnの実習をしてもらいます。②先週定めたテーマの方向性に従って、具体的にテーマを決めるために、自分たち自身でデータを分析してもらいます。
(6)(12/9 5限)テーマ決めのために分析をしてもらいます。最後に、チームで相談の上、テーマ(課題)を決めてもらって、発表してもらいます。
(7)(12/16 3限)より良いモデルを作るために必要なことを講義します。(精度の指標、オーバーフィッティング、その他の手法など)
(8)(12/16 4限)テーマに従ってモデルを作ってもらいます。
(9)(12/16 5限)テーマに従ってモデルを作ってもらいます。最後に、各チームの中間報告をしてもらいます。T.A.の方から各チームに年末年始の宿題を出してもらいます。(各チームのテーマに鑑みて、不足している点、ここは見ておいた方が良い点などを指摘します。)
(10)(1/20 3限)年末に出した課題に対して、各チームでどう対応したのかを簡単に発表してもらいます。その後、各チームでモデルの作成を行ってもらいます。
(11)(1/20 4限)最初に、前の時間に出てきた各チームの問題点や解決方法のうち、全体で問題とすべきものを共有します。各チームでモデルの作成を行ってもらいます。
(12)(1/20 5限)最初に、前の時間に出てきた各チームの問題点や解決方法のうち、全体で問題とすべきものを共有します。各チームでモデルの作成を行ってもらいます。最後に各チームの状況を報告してもらいます。発表のために、あと、何が必要なのかを講師陣がアドヴァイスします。
(13)(1/27 3限)各チームで最終発表の準備を行ってください。
(14)(1/27 4限)各チームで最終発表を行っていただきます。(各チーム10分程度)
(15)(1/27 5限) ①各チームの最終発表に対する講評を講師陣および、データ提供企業様に行っていただきます。②プロがやった分析を参考までに発表します。
実務経験を活かした
授業内容
(実務経験内容も含む)
/Course content utilizing practical experience
授業時間外の学習
(予習・復習等)(1,000文字以内)
/Preparation and review outside class(up to 1,000 letters)
参考書籍を提示する(Webページ参照)。
成績評価方法
および評価基準
(最低達成基準を含む)
(1,000文字以内)
/Evaluation and grading
(up to 1,000 letters)
分析対象事業の状況把握、データの収集・加工・分析アプローチ、分析結果から新たな価値(課題解決策、事業方向性、アイディア提案など)を見出せるか、及びプレゼンテーション結果等による総合判断。グループワークでの関与率やコミュニケーション力も評価する。また、講義に関与した産業界のデータサイエンティストやエンジニア、本学教員の評価を反映する。
オフィスアワー:
授業相談(1,000文字以内)
/Office hours(up to 1,000 letters)
フォーラムを作成するので、講義時間外にもそこで講師が質問に答える。
学生へのメッセージ(1,000文字以内)
/Message for students(up to 1,000 letters)
実際にデータを使って、データサイエンスの概要を学びます。データに向き合って、何らかの知見を引き出す醍醐味を体験していただければと思います。「データアントレプレナー実践論」の単位も取得した受講生に対して「データアントレプレナー集中講義受講修了証」を発行する。
その他
/Others
重要! 受講する方は、上記授業関連WeBページから事前登録すること。

データサイエンティストに関心がある方は、無料で有益な情報を提供していますので、データサイエンティスト協会 一般会員へ、ぜひご登録ください。
https://www.datascientist.or.jp/membership/index.html
キーワード
/Keywords
データサイエンス、ビッグデータ、人工知能、統計学、多変量解析、機械学習、データマイニング、エンジニアリング、プログラミング。