教材:高中信息技术教材里的数据科学

    张记存

    高中信息技术教材引导学生通过了解如何采集、存储、组织、处理、分析与可视化表达数据,认识数据对日常生活的影响,并形成数据的安全意识。下面笔者梳理一下教材中与数据科学相关的具体内容。

    数据

    ①定义:数据是对客观事物的符号表示。②特征:二进制、语义性、分散性、多样性与感知性。③来源:按照获取渠道,可以将数据分为两类——直接数据和间接数据。④收集方法:直接数据的收集方法,如调查法、访谈法等。间接数据的收集方法,如查阅文献资料等。

    数据采集

    1.模拟信号、数字信号及相互转换

    模拟信号的值是随时间连续变化的,波形光滑。数字信号随时间的变化是非连续的,是离散的。通过一定的规则和方法可以实现模拟信号和数字信号的相互转换,将模拟信号转化为数字信号的过程称作模数转换,将数字信号转换成模拟信号称为数模转换。

    2.进制及转换

    在计算机科学中,除了使用二进制外,人们还经常使用八进制和十六进制。字母D表示十进制,字母B表示二进制,字母O表示8进制,字母H表示16进制。

    3.编码

    (1)文本编码

    用于文本数据字符编码的方案有多种类型,其中ASCII码和Unicode是最为典型的两种编码方案。

    (2)图像编码

    图像文件大小的计算公式为:图像文件大小=图像宽度×图像高度×色彩深度/8(字节)。

    (3)音频编码

    音频文件的大小取决于采样频率、量化位数、声道数和时长,音频文件大小的计算公式为:音频文件大小=采样频率×量化位数×声道数×时长/8(字节)。

    (4)视频编码

    视频是由以一定的速度连续播放的一组静态图像形成的,这些静态图像被称为帧。

    数据存储

    计算机中存储容量最小的单位是比特(bit)。8bit为一个基本单位,称为字节(Byte)。常见的单位还有KB、MB、GB、TB等。

    數据分析

    数据分析是在一大批杂乱无章的数据中,运用数字化工具和技术,探索数据内在的结构和规律,构建数学模型,进行可视化表达,通过验证将模型转化为知识,为诊断过去、预测未来发挥作用。

    可视化表达及数据分析报告

    以图形、图像和动画等方式更加直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等的表达方式称为数据可视化表达。

    数据分析报告是项目研究结果的展示,也是数据分析结论的有效承载形式。

    大数据

    大数据的5Ⅴ特征:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。

    数据安全

    威胁数据安全的因素有很多,如硬盘驱动器损坏、操作失误等。

    对于数据安全,不仅要做好防护,还应提高数据本身的安全,常见的数据校验方法有MD5等。