![]() ![]() |
講義概要/Course Information |
科目基礎情報/General Information |
授業科目名 /Course title (Japanese) |
実践ソフトウェア開発基礎論 | ||
---|---|---|---|
英文授業科目名 /Course title (English) |
Fundamentals of Practical Software Development | ||
科目番号 /Code |
|||
開講年度 /Academic year |
2023年度 | 開講年次 /Year offered |
全学年 |
開講学期 /Semester(s) offered |
前学期 | 開講コース・課程 /Faculty offering the course |
博士前期課程 |
授業の方法 /Teaching method |
講義 | 単位数 /Credits |
2 |
科目区分 /Category |
大学院専門教育科目 - 専門科目Ⅰ | ||
開講類・専攻 /Cluster/Department |
情報学専攻 | ||
担当教員名 /Lecturer(s) |
西野 哲朗 | ||
居室 /Office |
|||
公開E-mail |
harada@uec.ac.jp | ||
授業関連Webページ /Course website |
https://www.uec.ac.jp/education/undergraduate/advanced_literacy/ | ||
更新日 /Last update |
2023/03/19 22:08:24 | 更新状況 /Update status |
公開中 /now open to public |
講義情報/Course Description |
主題および 達成目標(2,000文字以内) /Themes and goals(up to 2,000 letters) |
データサイエンスの実務においてポピュラーな手法である、勾配ブースティング決定木について座学と演習を通して体得する。座学では決定木から基礎を学ぶ。演習では、講義用の機械学習コンペティションへの参加を通して、技術活用の一連の流れを反復する。また、チームでの演習を通して、短期間での開発についても学ぶ。 In this lecture, students will learn Gradient Boosting Decision Tree, one of the most popular techniques in data science, through lectures and exercises. In the lectures, students will learn the basics theory from decision trees. In the exercises, students will learn the sequence of technology iteratively through lecture-based machine learning competitions. Students also experience short-term development in teams. |
---|---|
前もって履修 しておくべき科目(1,000文字以内) /Prerequisites(up to 1,000 letters) |
微分積分、線形代数、確率論、統計学などの、理工系の大学1・2年生レベルの数学・統計の基礎科目 Basic subjects in mathematics and statistics such as calculus, linear algebra, probability theory, and statistics, etc. |
前もって履修しておくこ とが望ましい科目(1,000文字以内) /Recommended prerequisites and preparation(up to 1,000 letters) |
numpy, pandasを含めたPythonの基本的な使い方 Basic usage of Python including numpy and pandas |
教科書等(1,000文字以内) /Course textbooks and materials(up to 1,000 letters) |
参考書: 門脇大輔、坂田隆司、保坂圭佑、平松雄司 著「Kaggleで勝つデータ分析の技術」 技術評論社 Trevor Hastie, Robert Tibshirani, Jerome Friedman ; 井尻ほか 訳「統計的学習の基礎 データマイニング・推論・予測」 共立出版 その他の講義資料・スライドは講義中に配布する。 Reference: 門脇大輔、坂田隆司、保坂圭佑、平松雄司 「Kaggleで勝つデータ分析の技術」 技術評論社 Trevor Hastie, Robert Tibshirani, Jerome Friedman “The Elements of Statistical Learning” Springer Other lecture materials and slides will be provided in the lecture. |
授業内容と その進め方(2,000文字以内) /Course outline and weekly schedule(up to 2,000 letters) |
第1回 講義:ガイダンス、決定木(1) Lecture: Guidance, Decision Tree models(1) 第2回 講義:決定木(2) Lecture: Decision Tree models(2) 第3回 コンペティション1:ガイダンス、チーム開発(1) Competition1: Guidance, Development by team(1) 第4回 コンペティション1:チーム開発(2) Competition1: Development by team(2) 第5回 コンペティション1:発表と振り返り Competition1: Presentation and rap up 第6回 講義:バギングとブースティング Lecture: Bagging and Boosting 第7回 講義:勾配ブースティング決定木とその実装例 Lecture: Gradient Boosting Decision Tree and its implementation example 第8回 コンペティション2:ガイダンス、チーム開発(1) Competition2: Guidance, Development by team(1) 第9回 コンペティション2:チーム開発(2) Competition2: Development by team(2) 第10回 コンペティション2:発表と振り返り Competition2: Presentation and rap up 第11回 講義:勾配ブースティング決定木の解釈 Lecture: Interpreting Gradient Boosting Decision Trees 第12回 講義:その他関連するトピック Lecture: Other related topics 第13回 コンペティション3:ガイダンス、チーム開発(1) Competition3: Guidance, Development by team(1) 第14回 コンペティション3:チーム開発(2) Competition3: Development by team(2) 第15回 コンペティション3:発表と振り返り Competition3: Presentation and rap up |
実務経験を活かした 授業内容 (実務経験内容も含む) /Course content utilizing practical experience |
担当教員の実務経験から、実社会における機械学習の応用事例と応用上の課題、その対策について言及しながら講義する。 Lectures will be given referring to application examples of machine learning in the real world, problems in application, and their countermeasures. |
授業時間外の学習 (予習・復習等)(1,000文字以内) /Preparation and review outside class(up to 1,000 letters) |
座学の中で簡単な小課題を出すことがある。コンペティションごとに、まとめたレポート課題を出す。 Small assignments will be given in the lectures. A summary report is issued for each competition. |
成績評価方法 および評価基準 (最低達成基準を含む) (1,000文字以内) /Evaluation and grading (up to 1,000 letters) |
成績は小課題(20%)とレポート課題(60%)、演習への取組状況(20%)を基に評価する。 ただしGPTの進化次第では、追加で対面での試験を実施する可能性がある。 Grades will be evaluated based on small assignments (20%), reports for competitions (60%), and progress on exercises (20%). However, depending on the evolution of GPT, additional face-to-face tests may be conducted. 単純な表形式のデータに対して、GBDTモデルを構築するところから、モデル改善、検証、解釈まで1通りの流れを実施できることをもって合格とする To be certified, students must be able to build a GBDT model, improve, verify, and interpret, for simple tabular data. |
オフィスアワー: 授業相談(1,000文字以内) /Office hours(up to 1,000 letters) |
授業中にお知らせします。 TBA |
学生へのメッセージ(1,000文字以内) /Message for students(up to 1,000 letters) |
上記の合格の水準は、現在では実務家のデータサイエンティストにとって必須に近いスキルです。この水準に満足せず、より高いものを目指してください。 The above certification standards are now essential skills for practical data scientists. Don't settle for this standard, aim higher. |
その他 /Others |
Kaggle環境を用います。土曜日に開講しますのでご注意ください。 We use Kaggle environment. Note that classes will be held on Saturdays. |
キーワード /Keywords |
人工知能、データサイエンス、機械学習、Kaggle AI, Data Science, Machine Learning, Kaggle |