年中了
前言
今年已过半,最近很充实,随便写点东西吧!
专业
现在有太多人,热衷于包装各种名词,缺乏对专业的敬畏!
专业之所以被称之为专业,是因为从事某些行业,往往需要大量的背景知识!
分工
专业化分工就是要把企业活动的特点和参与企业活动的员工的特点结合起来,把每位员工都安排在适当的领域中积累知识、发现技能从而不断地提高工作效率。(摘自百度百科)
老板
有个编剧说:煤老板是最好的投资人,他们基本不会干预创作。煤老板有一个安全生产的意识,他们特别尊重专业的人。
效能
磨刀不误砍柴功:钝刀砍柴,看起来挺卖力,但效率真的高吗?效能呢!
商业社会,不重视效能就是耍流氓!
工具
工具本身无好坏,在于使用工具的人。如钝刀,砍柴是不怎么好用,但钝刀砍骨头却挺好使。有经验的专业人员,懂得在合适的时候选择合适的工具。
不仅仅是快
注意,我说的是效能,不是效率!与效率相比,效能意味着不仅要速度快,还要质量好。不能说你十分钟把活干完了,然后还要再花俩小时找问题,再花几个小时把问题解决掉。这样的快,有什么意义?
以数据为例,不经过数据工程直接把各种数据拿来做数据产品,这样最快。但数据中存在的各种问题不解决,在后续的使用中或是理解中,都需要额外的成本。
平衡
追求效能,是无止境的,只能尽力去提升,在快与好之间找到平衡。
在平时,应该注重知识的积累与工具的学习。没有专业工具的支持,理论知识也就是无本之木,要注意理论联系实际,避免夸夸其谈、纸上谈兵。
平时不注重学习,在工作中一味的埋头苦干,连效率都没有,更没效能。
闲时勤练兵,忙时才能打仗!平常应该多注意学习,夯实自己的理论知识与技术,掌握过硬的专业知识。做到心中有数、知行合一,并用自己的专业知识将难点解决掉,相对快速的把工作做好!
数据
很多人对数据有误解,以为数据就是数据!
那些不重视数据的人,都在不同项目阶段被各种各样的数据问题折磨着!
数据啊数据
从结构上来区分的话,数据可以分为结构化数据与非结构化数据两大类。我们日常中用来分析或者是各种系统中的数据一般都是结构化数据,常见的结构化数据一般是指可以存储在数据库中的各种数据类型,如我们经常接触的shp数据、mdb数据、gdb数据都可以认为是结构化数据。非结构化数据一般是指各种栅格图片、文本、以及各种报表。对于计算机来讲,结构化数据比较好理解。虽然现在有机器学习,但对于计算机来讲非结构化数据还是很难理解。
不管是结构化数据还是非结构化数据,一般都不能拿来进行分析或使用。数据在使用之前,往往需要做一些处理,处理的过程,可以称之为:数据工程;处理后的数据,可以称之为:数据产品!
数据工程
数据工程,是指面向不同计算平台和应用环境,使用信息系统设计、开发和评价的工程化技术和方法。以工程化作为基本出发点的数据处理、分析和应用方法与技术,是计算机科学与技术学科的重要内容、核心与趋势,具有广泛的应用和良好的前景。(摘自百度百科)
从原始数据,到数据产品中所需要做的处理,诸如格式转换、数据清洗、数据质检等处理,都可以称之为数据工程。针对空间数据,数据工程还应包括数据纠偏、数据投影、多源数据的不同坐标系的统一等操作。数据工程的工作是否做到位、完备,决定了最终数据产品的质量。数据产品的质量,决定了业务系统中的数据否正确,以及最终的数据分析成果是否可靠。
数据工程,是基石!根基不牢,地动山摇!
数据产品
一般而言,系统或者分析模型,都很难在其本身再塞进去一个多源数据整合工具,所以一般情况下都是直接给模型或系统提供其所需要的数据产品。也就是说,数据在使用之前,要经过数据工程。经过数据工程的数据产品,至少需要满足以下几点:
1、一致;
一致性包含多方面,对于数据库中的表数据而言,数据库各表的名称、字段应保持一致,不能一会英文一会拼音,一会首拼一会全拼。各表中的字段名含义相同的应保持一致,比如表的主键不能一会叫id一会叫pid、kid,要素名称不能一会叫name一会又叫feature_name。对于空间数据而言,各图层还应保持坐标系统的一致性,不能一会平面一会球面。诸如此类的数据不一致问题,如果不在数据工程的阶段解决掉,除了徒增整个项目的复杂性、耗费项目参与人员的精力之外,毫无益处。
2、完整;
数据产品的完整,既要要素自身完整,也要保持整体的完整。自身的完整指数据的各必填字段不能为空,整体的完整是指数据之间应连续,无遗漏。对于空间数据而言,应能完全覆盖研究区域,无缺失。
3、逻辑;
数据产品一般有自身的逻辑。比方说一张桌子四条腿(别杠啊,这里只是举个例子,毕竟三条腿的桌子我也见过!),如果你把桌子再细分一下,细分成桌子面和桌子腿,把桌子面和桌子腿的信息抽象一下存在数据库里。那么你最终的数据产品中,面表与腿表之间的逻辑就需要否满足一对四的关系。
4、正确
数据产品最重要的一条,正确!正确!正确!
总结
不把夸夸其谈当专业,让专业的人,做专业的事情!
数据处理与分析,需要的是数据工程的专业人员,没有专业,哪来的效能,哪来的数据产品?
敬畏专业,敬畏生命,敬畏职责,敬畏规章!