在数据分析过程中,我们经常会遇到线型拟合问题。标准的做法是用最小二乘法(least-squares method)来计算相关系数,用协方差矩阵(covariance matrix)估计误差。不过这是在假定所有数据点都是绝对精确的情况下才成立。而在实际工作中,测量值不可避免地带有误差,忽略这些误差显然会低估相关系数的误差。那么该如何合理考虑数据点的误差,并绘制相应的置信带(confidence band,表示拟合函数的可能出现范围)呢?这里我们借助Python中的相关函数来看一下。

在数据分析过程中,我们经常会遇到线型拟合问题。标准的做法是用最小二乘法(least-squares method)来计算相关系数,用协方差矩阵(covariance matrix)估计误差。不过这是在假定所有数据点都是绝对精确的情况下才成立。而在实际工作中,测量值不可避免地带有误差,忽略这些误差显然会低估相关系数的误差。那么该如何合理考虑数据点的误差,并绘制相应的置信带(confidence band,表示拟合函数的可能出现范围)呢?这里我们借助Python中的相关函数来看一下。
2014年MIT的一个研究组根据联合国教科文组织的“译文索引”制作了一个世界各语种影响力的权重图(中文是上图中下方的小红点)。很明显,中文图书的引进和翻译都还远落后于其他语种,引进的数量还不到英语的百分之一。一方面各行业中都有大量的专业术语没有合适的中文译名,从业人员都习惯于英文表述。另一方面非专业人士的译法五花八门,出入很大。这个状况给知识的传播和普及造成了许多混乱和障碍。虽然目前网络上的英汉词典和查询网站众多,但其中的术语名词质量参差不齐,来源模糊不清,都无法替代传统译名手册成为可靠的信息来源。
下面列出一些较为可靠的中文术语翻译资源,供译者和编辑参考。
继续阅读