大数据的界说与布景
大数据的典型特征
大数据具有以下四个典型特征:
1. 很多性(Volume)
大数据的数据量巨大,通常以PB(拍字节)、EB(艾字节)乃至ZB(泽字节)为单位。例如,全球每天发生的数据量高达2.5EB,其间交际媒体、物联网设备、电子商务等范畴的数据量尤为巨大。
2. 速度(Velocity)
大数据的流通速度极快,需求实时或近实时地处理和剖析。例如,金融交易、搜索引擎、交际媒体等范畴的实时数据处理对速度要求极高。
3. 多样性(Variety)
大数据的类型多样,包含结构化数据、半结构化数据和非结构化数据。结构化数据如数据库中的表格数据,半结构化数据如XML、JSON等,非结构化数据如文本、图片、视频等。
4. 价值密度低(Value Density)
大数据中的信息价值密度较低,需求经过数据发掘、机器学习等技能手段从海量数据中提取有价值的信息。例如,从交际媒体数据中提取用户情感、从电商数据中剖析消费者行为等。
大数据的5V特色
除了上述四个典型特征外,大数据还具有以下五个特色,即5V特色:
1. Volume(很多)
如前所述,大数据的数据量巨大,需求高效的数据存储和处理技能。
2. Velocity(高速)
大数据的流通速度极快,需求实时或近实时地处理和剖析。
3. Variety(多样)
大数据的类型多样,包含结构化数据、半结构化数据和非结构化数据。
4. Value(价值化)
大数据的价值密度低,需求经过数据发掘、机器学习等技能手段从海量数据中提取有价值的信息。
5. Veracity(真实性)
大数据的真实性难以确保,需求经过数据清洗、去重等技能手段进步数据质量。
大数据的使用范畴
大数据在各个范畴都有广泛的使用,以下罗列几个典型使用范畴:
1. 金融范畴
大数据在金融范畴的使用包含危险操控、诈骗检测、信誉评价、投资决策等。
2. 医疗范畴
大数据在医疗范畴的使用包含疾病猜测、患者办理、药物研制、医疗资源优化等。
3. 互联网范畴
大数据在互联网范畴的使用包含搜索引擎优化、个性化引荐、广告投进、用户行为剖析等。
4. 交通范畴
大数据在交通范畴的使用包含智能交通办理、交通流量猜测、公共交通优化等。
5. 动力范畴
大数据在动力范畴的使用包含动力消耗猜测、动力优化装备、可再生动力办理等。
大数据具有很多性、速度、多样性和价值密度低一级典型特征,已成为当今社会的重要资源。跟着大数据技能的不断发展,其在各个范畴的使用将越来越广泛,为人类社会带来更多价值。