共 38 篇文章
显示摘要每页显示  条
与大多数编程语言相同,正则表达式里使用''''''''''''''''作为转义字符,这就可能造成反斜杠困扰。假如你需要匹配文本中的字符'''''''''''''''',那么使用编程语言表示的正则表达式里将需要4个反斜杠'&...
立即执行函数也可以理解为立即调用一个匿名函数。立即执行函数最常见的应用场景就是:将 var 变量的作用域限制于你们函数内,这样可以避免命名冲突。对于闭包(closure),当外部函数返回之后,内部函数依然可以访问外部函数的变量。代码中,外部函数 f1 只执行了一次,变量 N 设为 0 ,并将内部函数 f2 赋值给了变量 result 。JavaScript 会将所...
这里有一份超实用爬虫操作攻略。从抓取对象进行分类,爬虫大致分为三类:静态网页爬虫、动态网页爬虫、移动应用程序爬虫。静态网页爬虫。动态网页爬虫。这里是一个模板,从原始的 widget 变成了HTML,其中数据部分是单独通过接口获取的,这与微信公众号那一类完全获取整个HTML 仍然有本质的区别,简单说,就是如果抓包的话,我们会看到的微信公...
从零开始学Python--数值计算及正则表达式。1)Python自带的数值函数。字符串处理。1)字符串索引与切片(与上一期中列表、元组类似)2)字符串拼接(字符串的加法与join方法)3)字符串重复(字符串的乘法)字符串中的正则表达式。2)结合re模块完成字符串的匹配。re.findall(pattern, string, flags=0)string-->需要处理的字符串。re.split...
这是一组含有缺失值的序列,我们可以结合sum函数和isnull函数来检测数据中含有多少缺失值:pandas为我们提供了非常强大的函数pivot_table(),该函数就是实现数据透视表功能的。在数据框中使用多层索引,可以将整个数据集控制在二维表结构中,这对于数据重塑和基于分组的操作(如数据透视表的生成)比较有帮助。有关更多的pandas介绍,可参考pan...
在我看来,序列或数据框的索引有两大用处,一个是通过索引值或索引标签获取目标数据,另一个是通过索引,可以使序列或数据框的计算、操作实现自动化对齐,下面我们就来看看这两个功能的应用。数据框中同样有索引,而且数据框是二维数组的推广,所以数据框不仅有行索引,而且还存在列索引,关于数据框中的索引相比于序列的应用要强大的多,这部...
In [124]: np.where(arr11.In [125]: arr13 = np.array([[1,2,3,5],[2,4,1,6],[1,1,4,3],[2,5,4,1]])In [129]: np.trace(arr13) #返回方阵的迹(对角线元素之和),注意迹的求解不在linalg子例程中。In [133]: np.dot(arr13,arr13) #方阵的正真乘积运算。In [134]:arr14 = np.array([[1,-2,1],[0,2,-8],[-4,5,9]])In [143]: norm_dist = (1/n...
numpy中使用array()函数创建数组,array的首个参数一定是一个序列,可以是元组也可以是列表。横向拼接arr3和arr4两个数组,但必须满足两个数组的行数相同。纵向拼接arr3和arr4两个数组,但必须满足两个数组的列数相同。数组转换:tolist将数组转换为列表,astype()强制转换数组的数据类型,下面是两个函数的例子:In [67]: arr8 = np.array(np.a...
上一期我们使用pandas模块实现频数统计、缺失值处理、数据映射和数据汇总 4个知识点,这期我们再来聊聊关于pandas如何实现数据合并 、数据连接 、创建哑变量和连续数值的区间化的操作。这些变量直接放入到模型中(如回归模型)是有问题的(即使你已经用1,2,3...等数据表示),为解决这个问题,我们通常是将这些变量进行哑变量处理。该数据集中...
而在R语言中,table函数就是起到频数统计的作用,另外还提供了更加灵活的prop.table函数,可以直接求出比例。这里我们借助于pandas模块中的isnull函数、dropna函数和fillna函数。该函数的目的就是将用户指定的函数运用到数据集的纵轴即各个变量或横轴即各个行。如果你想要做类似SQL中的聚合操作,pandas也提供了实现该功能的函数,即groupby函...
帮助 | 留言交流 | 联系我们 | 服务条款 | 下载网文摘手 | 下载手机客户端
北京六智信息技术股份有限公司 Copyright© 2005-2024 360doc.com , All Rights Reserved
京ICP证090625号 京ICP备05038915号 京网文[2016]6433-853号 京公网安备11010502030377号
返回
顶部