风音屋株式会社(总部:东京都中央区,代表社员:横山翔)针对IT部门及参与数据运用的人员,正式开始一般提供可学习数据基础设施中分层及数据表设计实践知识的「数据建模培训」。 ## ■背景与目的 数据基础设施对于数据运用、推动DX及生成式AI是不可或缺的。在进行IT系统建置项目时,诸如「仅将数据集中在一处是没有意义的」、「有10种相似的销售数据会让用户或AI代理产生混淆」等情况,凸显了整理数据内容的重要性。 随之浮现的课题包括:「没有系统性学习数据基础设施建模的机会,希望从基础到实践一贯地掌握」、「数据表设计过度依赖个人,团队无法共享设计意图」、「无法想像如何将面临的课题与需求落实到数据模型中」。 风音屋收到许多此类咨询,并意识到阻碍日本企业运用数据和推动DX的因素之一,就是「缺乏系统性学习数据建模的实践型计划」。因此,由书籍《敏捷数据建模(Agile Data Modeling)》的译者「Yuzutaso (@yuzutas0)」主导开发了这套培训计划。 ## ■提供计划 这是一个在2天内系统性学习数据分析与数据基础设施设计不可或缺的「数据建模」的实践型计划。 ### 本讲座提供的价值 - 通过维度建模和BEAM✲表,从设计基础到实务应用都能掌握 - 通过成果审查和发表会,培养在团队中共享与改善设计意图的技能 - 通过使用自家公司数据进行上机实作,留下能立即应用于现场的培训成果 ### 【Day 1】 基础讲座 学习维度建模的基础,涵盖至使用SQL、Python、Excel进行实作。 1. 维度建模概要 2. 事实(Fact)设计 3. 维度(Dimension)设计 4. BEAM✲表、事件矩阵 5. 分层概要 6. 数据提供格式(宽表、摘要表) 7. 数据预处理 8. 数据流设计 9. SQL(例:dbt)、Python(例:AWS Glue或Google Colab)、Excel的实作步骤 ### 演练课题 安排数周的作业期间,请学员着手进行数据表的设计与实作。 通过以业务中处理的数据为题材,可以获得更直接链接到实务的学习。 - 设计文档(例:Miro等在线白板工具) - 实作完成的数据表(例:Snowflake或BigQuery的预览画面、dbt的设置档)