シラバス参照

講義概要/Course Information
2025/04/27 現在

科目基礎情報/General Information
授業科目名
/Course title (Japanese)
実践ソフトウェア開発基礎論
英文授業科目名
/Course title (English)
Fundamentals of Practical Software Development
科目番号
/Code
開講年度
/Academic year
2023年度 開講年次
/Year offered
全学年
開講学期
/Semester(s) offered
前学期 開講コース・課程
/Faculty offering the course
博士前期課程
授業の方法
/Teaching method
講義 単位数
/Credits
2
科目区分
/Category
大学院専門教育科目 - 専門科目Ⅰ
開講類・専攻
/Cluster/Department
情報学専攻
担当教員名
/Lecturer(s)
西野 哲朗
居室
/Office
公開E-mail
/e-mail
harada@uec.ac.jp
授業関連Webページ
/Course website
https://www.uec.ac.jp/education/undergraduate/advanced_literacy/
更新日
/Last update
2023/03/19 22:08:24 更新状況
/Update status
公開中
/now open to public
講義情報/Course Description
主題および
達成目標(2,000文字以内)
/Themes and goals(up to 2,000 letters)
データサイエンスの実務においてポピュラーな手法である、勾配ブースティング決定木について座学と演習を通して体得する。座学では決定木から基礎を学ぶ。演習では、講義用の機械学習コンペティションへの参加を通して、技術活用の一連の流れを反復する。また、チームでの演習を通して、短期間での開発についても学ぶ。
In this lecture, students will learn Gradient Boosting Decision Tree, one of the most popular techniques in data science,  through lectures and exercises. In the lectures, students will learn the basics theory from decision trees. In the exercises, students will learn the sequence of technology iteratively through lecture-based machine learning competitions. Students also experience short-term development in teams.
前もって履修
しておくべき科目(1,000文字以内)
/Prerequisites(up to 1,000 letters)
微分積分、線形代数、確率論、統計学などの、理工系の大学1・2年生レベルの数学・統計の基礎科目

Basic subjects in mathematics and statistics such as calculus, linear algebra, probability theory, and statistics, etc.
前もって履修しておくこ
とが望ましい科目(1,000文字以内)
/Recommended prerequisites and preparation(up to 1,000 letters)
numpy, pandasを含めたPythonの基本的な使い方

Basic usage of Python including numpy and pandas
教科書等(1,000文字以内)
/Course textbooks and materials(up to 1,000 letters)
参考書:
門脇大輔、坂田隆司、保坂圭佑、平松雄司 著「Kaggleで勝つデータ分析の技術」 技術評論社
Trevor Hastie, Robert Tibshirani, Jerome Friedman ; 井尻ほか 訳「統計的学習の基礎 データマイニング・推論・予測」 共立出版
その他の講義資料・スライドは講義中に配布する。

Reference:
門脇大輔、坂田隆司、保坂圭佑、平松雄司 「Kaggleで勝つデータ分析の技術」  技術評論社
Trevor Hastie, Robert Tibshirani, Jerome Friedman “The Elements of Statistical Learning” Springer
Other lecture materials and slides will be provided in the lecture.
授業内容と
その進め方(2,000文字以内)
/Course outline and weekly schedule(up to 2,000 letters)
第1回 講義:ガイダンス、決定木(1)
Lecture: Guidance, Decision Tree models(1)

第2回 講義:決定木(2)
Lecture: Decision Tree models(2)

第3回 コンペティション1:ガイダンス、チーム開発(1)
Competition1:  Guidance, Development by team(1)

第4回 コンペティション1:チーム開発(2)
Competition1:  Development by team(2)

第5回 コンペティション1:発表と振り返り
Competition1:  Presentation and rap up

第6回 講義:バギングとブースティング
Lecture: Bagging and Boosting

第7回 講義:勾配ブースティング決定木とその実装例
Lecture: Gradient Boosting Decision Tree and its implementation example

第8回 コンペティション2:ガイダンス、チーム開発(1)
Competition2:  Guidance, Development by team(1)

第9回 コンペティション2:チーム開発(2)
Competition2:  Development by team(2)

第10回 コンペティション2:発表と振り返り
Competition2:  Presentation and rap up

第11回 講義:勾配ブースティング決定木の解釈
Lecture: Interpreting Gradient Boosting Decision Trees

第12回 講義:その他関連するトピック
Lecture: Other related topics

第13回 コンペティション3:ガイダンス、チーム開発(1)
Competition3:  Guidance, Development by team(1)

第14回 コンペティション3:チーム開発(2)
Competition3:  Development by team(2)

第15回 コンペティション3:発表と振り返り
Competition3:  Presentation and rap up

実務経験を活かした
授業内容
(実務経験内容も含む)
/Course content utilizing practical experience
担当教員の実務経験から、実社会における機械学習の応用事例と応用上の課題、その対策について言及しながら講義する。
Lectures will be given referring to application examples of machine learning in the real world, problems in application, and their countermeasures.
授業時間外の学習
(予習・復習等)(1,000文字以内)
/Preparation and review outside class(up to 1,000 letters)
座学の中で簡単な小課題を出すことがある。コンペティションごとに、まとめたレポート課題を出す。
Small assignments will be given in the lectures.
A summary report is issued for each competition.
成績評価方法
および評価基準
(最低達成基準を含む)
(1,000文字以内)
/Evaluation and grading
(up to 1,000 letters)
成績は小課題(20%)とレポート課題(60%)、演習への取組状況(20%)を基に評価する。
ただしGPTの進化次第では、追加で対面での試験を実施する可能性がある。
Grades will be evaluated based on small assignments (20%), reports for competitions (60%), and progress on exercises (20%).
However, depending on the evolution of GPT, additional face-to-face tests may be conducted.

単純な表形式のデータに対して、GBDTモデルを構築するところから、モデル改善、検証、解釈まで1通りの流れを実施できることをもって合格とする
To be certified, students must be able to build a GBDT model, improve, verify, and interpret, for simple tabular data.
オフィスアワー:
授業相談(1,000文字以内)
/Office hours(up to 1,000 letters)
授業中にお知らせします。
TBA
学生へのメッセージ(1,000文字以内)
/Message for students(up to 1,000 letters)
上記の合格の水準は、現在では実務家のデータサイエンティストにとって必須に近いスキルです。この水準に満足せず、より高いものを目指してください。
The above certification standards are now essential skills for practical data scientists. Don't settle for this standard, aim higher.
その他
/Others
Kaggle環境を用います。土曜日に開講しますのでご注意ください。
We use Kaggle environment. Note that classes will be held on Saturdays.
キーワード
/Keywords
人工知能、データサイエンス、機械学習、Kaggle
AI, Data Science, Machine Learning, Kaggle