数据采集与编码
01.数据采集
1
获取方法
(1)观察、实验
人工方式获得
(2)互联网、物联网
网络或器件
2
数据采集——传感器
传感器是一种能感受被测量并按照一定规律转换成可用输出信号的器件或装置,通常由敏感元件和转换元件组成。
在科研、生产和日常生活中,常需要利用传感器对环境中的物理量、化学量和生物量等进行感知与测量,并转换成电信号,进行适当处理后形成数据。
03
动动脑,手机里有多少传感器?
1、摄像头
2、声音传感器
3、重力感应器、陀螺仪
4、光线传感器:根据光线强弱来改变屏幕亮度
5、温度传感器
6、磁场传感器:指南针、导航、记录运动速度、地理位置等等
4
互联网采集数据
网络爬虫是一种按照一定的规则,自动抓取网页上的数据的程序或脚本。
和人浏览网页的行为类似,网络爬虫也是通过网页中的超链接在网页间跳转。
02.数字化
定义:将模拟信号转换成数字信号的过程称为数字化。
采样:采样是将信号从连续j时间(空间)域上的模拟信号转换到离散时间(空间)域上的离散信号的过程,通过采样器实现。
量化:量化是指将信号的连续取值近似为有限个离散值的过程。
数字化:声音信号采样量化。
03.数制
1
数制的基本概念
十进制就是逢十进一
二进制就是逢二进一
十六进制就是逢十六进
2
计算机常用的各种进制数的表示
3
进制数标识
世界上有十种人,一种是懂二进制的,另一种是不懂的。
4
二进制转换规律
04.编码
1
ASCII码
基本的共有个,用1个字节中的低7位编码。
二进制范围为~,即十六进制的00~7F
2
字符编码
汉字编码分为外码、交换码、机内码和字形码。
外码,也叫作输入码,是用来将汉字输入到计算机中的一组键盘符号。常用的汉字输入码有拼音码、五笔字型码等。
计算机内部的汉字编码都用机内码,1个汉字或者汉语标点在计算机中占2个字节,英文字母或英文标点占1个字节。
一个字符一个字节,一个汉字两个字节。
1KB=B1MB=KB1GB=MB
1TB=GB1PB=TB1EB=PB
1ZB=EB(1B=8bit)
3
条形码
4