![]() ![]() |
講義概要/Course Information |
科目基礎情報/General Information |
授業科目名 /Course title (Japanese) |
データサイエンス演習 | ||
---|---|---|---|
英文授業科目名 /Course title (English) |
Data Science Studies | ||
科目番号 /Code |
UEC501z | ||
開講年度 /Academic year |
2023年度 | 開講年次 /Year offered |
3 |
開講学期 /Semester(s) offered |
前学期 | 開講コース・課程 /Faculty offering the course |
情報理工学域 |
授業の方法 /Teaching method |
演習 | 単位数 /Credits |
1 |
科目区分 /Category |
実践教育科目 | ||
開講類・専攻 /Cluster/Department |
情報理工学域 | ||
担当教員名 /Lecturer(s) |
西野 哲朗 | ||
居室 /Office |
東3-826 | ||
公開E-mail |
nishino@uec.ac.jp | ||
授業関連Webページ /Course website |
Google Classroomを見てください / See our Google Classroom クラスコード:mu3kjkb Classの招待リンク:https://classroom.google.com/c/NjAzMTkzNjMxMDY2?cjc=mu3kjkb | ||
更新日 /Last update |
2023/04/12 17:11:04 | 更新状況 /Update status |
公開中 /now open to public |
講義情報/Course Description |
主題および 達成目標(2,000文字以内) /Themes and goals(up to 2,000 letters) |
本授業では、今後、社会人として重要な素養となる、データサイエンスの実践的な教育を行う(就職の際にも、必須のスキルとなる)。具体的には、実際のデータサイエンスの課題に取り組むことによって、基本的なデータ分析スキルを向上させることを第一の目的とする。さらに、データサイエンスが社会でどのように活用されているのかを知ることを第二の目的とする。本授業では、国際的なデータサイエンス関連サイトKaggleの過去のコンペに参加することを目指す。(すでにコンペは締め切られているので、良い成績を上げても賞金を受け取ることはできないが、非常に良い練習になる。) |
---|---|
前もって履修 しておくべき科目(1,000文字以内) /Prerequisites(up to 1,000 letters) |
総合コミュニケーション科学 |
前もって履修しておくこ とが望ましい科目(1,000文字以内) /Recommended prerequisites and preparation(up to 1,000 letters) |
確率・統計関係の科目 |
教科書等(1,000文字以内) /Course textbooks and materials(up to 1,000 letters) |
斉藤・西野・庄野:「実践AI・データサイエンス入門」, 学術図書出版(2022刊行予定) |
授業内容と その進め方(2,000文字以内) /Course outline and weekly schedule(up to 2,000 letters) |
第1回 Pythonの復習(1)・Pythonプログラミング入門 第2回 Pythonの復習(2)・実際のデータの集計方法 第3回 Pythonの復習(3)・データの可視化 第4回 HomeCreditRiskコンペについて 第5回 コンペのデータ外観 第6回 Kaggleサイトの使い方 第7回 データサイエンスの社会実装(1), データ倫理(1):個人情報の活用と保護(日本の法制度の展開) 第8回 テストデータの特徴理解とリーク(validationと予測モデル) 第9回 LightGbmの使い方 第10回 データサイエンスの社会実装(2), データ倫理(2):個人情報保護の国際的展開とビジネスの変貌 第11回 特徴量エンジニアリング(1)・コンペデータを使った新しい特徴の作り方 第12回 データサイエンスの社会実装(3), データ倫理(3):データサイエンスのFairness, Accountability, Reproductivity 第13回 特徴量エンジニアリング(2)・コンペデータを使った新しい特徴量の作り方:別の視点 第14回 データサイエンスの社会実装(4), データ倫理(4):データセキュリティ 第15回 優秀モデル報告会 |
実務経験を活かした 授業内容 (実務経験内容も含む) /Course content utilizing practical experience |
|
授業時間外の学習 (予習・復習等)(1,000文字以内) /Preparation and review outside class(up to 1,000 letters) |
各期間で定められた課題を実施すること。 Carry out the tasks specified in each period of the class |
成績評価方法 および評価基準 (最低達成基準を含む) (1,000文字以内) /Evaluation and grading (up to 1,000 letters) |
各回の課題を提出していればC以上の評価となる。(感想文あるいは選択式の問題に回答を提出すること。Kaggleについては最低1回は投稿すること。)AからCまでの評価は、選択式の問題の正答率による。Kaggleのスコア上位者については、選択式問題の解答による評価をアップさせる。(上位者がどの範囲になるのかは、状況による。) |
オフィスアワー: 授業相談(1,000文字以内) /Office hours(up to 1,000 letters) |
毎週木曜日の 17時から19時まで、Zoomでのミーティングが可能だが、あらかじめ連絡して予約をすること。(s-saito@uec.ac.jpへメールすること。) |
学生へのメッセージ(1,000文字以内) /Message for students(up to 1,000 letters) |
オンデマンドの講義資料は順次アップするが、第4回と第5回、および第15回はオンライン(Zoom)で授業を行うので、下記日時の授業には、なるべく、参加すること。もし、リアルタイムでの参加が難しい場合には、後日講義内容をオンデマンド教材としてアップするので、そちらを必ず聴講すること。 ・第4回・第5回開催日時:2022年4月23日午前9時から12時まで(2コマ連続) ・第15回開催日時:2022年7月9日午前10時半から12時まで |
その他 /Others |
(1)Kaggleのアカウント ・すでにアカウントを持っている人も、この講義用に別のアカウントを作ること。アカウント名は「uec_xxxx」として、「xxxx」のところに学籍番号を入れておくこと。この新しいアカウントをuecのメールアドレスで作り、投稿結果についての連絡がuecのメールアドレスに送られるようにしておくこと。 (2)データ分析の環境 ・わかっている人は、どんな環境を使っても構わない。ローカルのanacondaでも、あるいはローカルに構築したPython環境でも、GoogleColaboratory、kaggleのカーネルでも構わない。 ・実際にPythonでデータ分析をやるのが初めてだという人のために、最初の3回の復習講義では、GoogleのColaboratoryでデータを操作することを前提に映像資料を作ってある。初めての人、慣れてない人はColaboratoryを使うこと。Colaboratoryの使い方については、ガイドのPDF資料と映像資料を用意してある。 (3)Slackの活用 ・講義内容その他についての質問は専用のSlackワークスペースで受け付ける。 2021年度以前入学生が履修した場合は、理工系教養科目となる。 |
キーワード /Keywords |
データサイエンス、人工知能、機械学習 Data science, Artificial Intelligence, Machine learning |