python的内置数据类型非常丰富,大致可以分为五类:None、数字类型、序列类型、映射类型和集合类型。下面我将分别对他们进行介绍,做个总结以备以后查看。下面的表列出了各个类别下的具体数据类型。注:本文所讲的内容都是基于python2的,python3会有些不同。
类型分类 | 类型名称 | 描述 |
None | Type(None) | null对象None |
数字类型 | int | 整数 |
long | 长整数,任意精度(python2) |
float | 浮点数 |
complex | 复数 |
bool | 布尔值(True或False) |
序列类型 | str | 字符串 |
unicode | Unicode字符串(python2) |
list | 列表 |
tuple | 元组 |
xrange | xrang()创建的整数范围 |
映射类型 | dic | 字典 |
集合类型 | set | 可变集合 |
frozenset | 不可变集合 |
1.None
None表示一个null对象,这是一个空对象,如果一个函数没有返回值,则返回null对象。None没有任何属性,在布尔表达式中表示False。
2.数字类型
除了布尔类型外,所有数字类型都是有符号的。整数的表示范围在-2147483648和2147483647之间,长整数可以表示任意长度,只受可用内存大小的限制。
#整数 i = 123 i = int(123) #长整数 l = 123L l = long(123)
浮点数是双精度类型(64bit),和c语言中double相同,数值范围-1.710(-308)到1.710(308)。
f = 12.3 f = float(12.3)
复数使用一对浮点数表示,分为实部和虚部,使用real和imag访问,虚部后缀j或J。
c = 1.0 + 2.3j c = complex(1.0, 2.3) print c.real,c.imag
布尔值只有True和False两个值,分别映射为整数1和0。
b = False b = bool(True)
2.1.数字运算
除了布尔类型外,int、long、float和complex都可以使用的运算为:加、减、乘、除、整除、幂运算和取余。下面分别举例说明。
>>> 1 + 2 # 加法 3 >>> 1 - 2 # 减法 -1 >>> 2 * 3 # 乘 6 >>> 2 / 4 # 整数除 0 >>> 2 / 4.0 # 浮点除 0.5 >>> 3 // 2.0 # 整除 1.0 >>> 2 % 3 # 取余 2 >>> 3 ** 2 # 幂运算 =3^2 9
对于整数还可以进行位运算,共有6种位运算:取反(~)、左移(<<)、右移(>>)、异或(^)、按位或(|)、按位与(&)。
>>> ~1 # 1取反后为-2的补码 -2 >>> 8 << 1 # 左移 16 >>> 8 >> 2 # 右移 2 >>> 1 ^ 3 # 01 和 11 异或得到10,就是2 2 >>> 1 | 3 # 01 和 11 位或得到11,就是3 3 >>> 1 & 3 # 01 和 11 位与得到01,就是1 1
布尔类型可以通过布尔表达式取值,布尔比较运算符有6种:小于(<)、小于等于(<=)、大于(>)、大于等于(>=)、等于(==)、不等于(!=)。
>>> 1 < 2 True >>> 1 <= 2 True >>> 1 > 2 False >>> 1 >= 2 False >>> 1 == 2 False >>> 1 != 2 True
对于布尔类型还可以进行逻辑运算,有3种运算:逻辑非(not)、逻辑非或(or)、逻辑与(and)。
>>> not True False >>> True or False True >>> True and False False
2.2.常用数字类型函数
abs():返回给定对象的绝对值。
>>> abs(-2) 2
divmod():把除法和取余运算结合起来,返回一个包含商和余数的元组。
>>> divmod(10, 3) (3, 1)
pow():两个参数,幂运算。三个参数,乘方后取余。
>>> pow(2, 5),pow(2, 5, 10) (32, 2)
round():四舍五入
>>> round(3.4),round(3.6) (3.0, 4.0)
floor():向下取整, ceil():向上取整, sqrt():开方, 需要math模块。
>>> from math import floor,ceil,sqrt >>> floor(3.6),ceil(3.6),sqrt(9) (3.0, 4.0, 3.0)
conjugate():复数取共轭
>>> c = 2 + 3j >>> c.conjugate() (2-3j)
3.序列类型
序列表示索引为非负数的有序对象集合,包括字符串、列表和元组。字符串是字符的序列,列表和元组是任意对象的序列。字符串和元组是不可变的,而列表可以插入、删除和替换。所有序列支持迭代。
3.1.字符串
创建一个字符串很简单,但表示字符串的方法有很多。
s = 'string' s = "string" # 和上面单引号一样 s = '''string''' # 三引号之间的内容都被保留,用于多行输入 s = r"string" # 原生字符,关掉字符串中的转义。 s = u"string" # unicode字符串
字符串的方法很多,但不会改变字符串里的内容,常用的如下表所示。
方法 | 描述 |
index(sub[,start[,end]]) | 找到子字符串sub首次出现的位置,否则返回-1 |
find(sub[,start[,end]]) | 找到子字符串sub首次出现的位置,否则报错 |
startswith(prefix[,start[,end]]) | 检查是否以prefix开头 |
count(sub[,start[,end]]) | 计算子字符串sub出现的次数 |
decode([encoding[, errors]]) | 以encoding解码字符串,返回unicode字符串(只用于字节字符串) |
encode([encoding[, errors]]) | 以encoding编码字符串(只用于unicode字符串) |
upper() | 返回大写形式 |
lower() | 返回小写形式 |
split(sep[,maxsplit]) | 以sep为分隔符分割字符串,maxsplit为最大分割次数 |
join(t) | 使用当前字符串为分隔符连接t中的字符串 |
format(*args, kwargs) | 格式化字符串 |
举个format的例子,{0}表示*args的第一个值,{name}表示kwargs中name的值。
>>> "Here is {0},I'm {name}.".format("wuyuans.com", name="wuyuan") "Here is wuyuans.com,I'm wuyuan"
3.2.列表和元组
列表的内容可变,可以包含任意对象,使用中括号表示。
元组的内容不可变,可以包含任意对象,使用圆括号表示。
l = [1, 2, 3, '4', '5'] # 列表 l = list((1, 2, 3, '4', '5')) t = (1, 2, 3, '4', '5') # 元组 t = tuple("1234")
列表的方法主要用于改变里面的内容,下面列出列表常用的方法。
方法 | 描述 |
list(s) | 将s转化为一个列表 |
s.append(x) | 将新元素x加到s的尾部 |
s.extend(t) | 将新列表t加到s的尾部 |
s.count(x) | 计算x的出现次数 |
s.index(x[, start[, stop]]) | 搜索x元素 |
s.insert(i, x) | 在i处添加x |
s.pop([i]) | 弹出第i个元素,如果省略i,弹出最后一个 |
s.remove(x) | 移除x |
s.reverse(x) | 反转列表 |
s.sort([key[, reverse]]) | 排序 |
也可以通过索引来删除列表中的元素。
>>> l = [1, 2, 3, 4, 5] >>> del l[1] >>> l [1, 3, 4, 5]
3.3.序列通用操作
所有序列都可以通过索引来访问,第一个元素的索引为0,-1为最后一个元素,-2倒数第二个,一次类推。
切片操作:指定索引范围,返回相应的子序列。
还有一些常用的,如下所示
>>> t = (1, 2, 3, 4, 5) >>> l = [1, 2, 3, 4, 5] >>> t[0] 1 >>> t[1:4] # 索引1~4 (2, 3, 4) >>> t[1:4:2] # 索引1~4,步进为2 (2, 4) >>> len(t) # 序列长度 5 >>> max(t) # 最大值 5 >>> min(t) # 最小值 1 >>> sum(t) # 序列求和 15
3.4.xrange()对象
xrange()对象比较特殊,他表示一个整数范围,只有访问它时才会计算他的值,所以切片操作是不能用于xrange对象的。xrange对象由xrange([i, ] j [, stride])函数创建,i为起始值,stride为步进值。
>>> x = xrange(1,10,2) >>> for i in x: print i 1 3 5 7 9
4.映射类型
字典(dict)是python为唯一的内置映射类型,任何不可变对象都可以用作字典的键值,如字符串、数字、元组等。字典使用大括号表示,键和值之间用冒号分割,各个键值间用逗号隔开。映射对象是无序的。
d = dict((['name', 'wuyuan'], ['age', 23])) d = {'name': 'wuyuan', 'blog': 'wuyuans.com', 'age': 23} d['school'] = 'HDU' # 添加一项
字典的常用方法和操作
方法和操作 | 描述 |
len(d) | 返回字典d的项目数 |
d[k] | d中键k的值 |
del d[k] | 删除d[k] |
k in d | 如果k是d的键值,返回True |
d.clear() | 清空d |
d.copy() | 返回d的一个拷贝 |
d.fromkeys(s[, value]) | 返回一个新字典,s中的所有元素作为新字典的键,值为value |
d.get(k[, v]) | 返回d[k],没有则返回v |
d.items() | 返回由键值组成的序列,主要用于历遍 |
d.keys() | 返回由键组成的序列 |
d.values() | 返回由值组成的序列 |
d.pop(k[, default]) | 弹出d[k],没有则返回default |
d.update(b) | 将b中对象添加到d中 |
字典的历遍方式:
#使用键历遍 for i in d: print i,d[i] #使用键值历遍 for k,v in d.items(): print k,v
5.集合类型
集合是唯一项的无序集,集合不提供索引或切片操作,集合的长度可变,但放入里面的必须是不可变的。集合分为两种:可变集合(set)和不可变集合(frozenset)。
s = set([1, 2, 3]) fs = frozenset([1, 2, 3])
集合通用方法和操作
方法和操作 | 描述 |
len(s) | 返回集合s的项目数 |
s.copy() | 返回集合s的一份副本 |
s.difference(t) | 求差集,返回在s中,但不在t中的项目 |
s.intersection(t) | 求交集,返回同时在s和t中的项目 |
s.isdisjoint(t) | s和t中没有相同项,返回True |
s.issubset(t) | s是t的子集,返回True |
s.issuperset(t) | s是t的超集,返回True |
s.union(t) | 求并集,返回在s或t中的项目 |
可变集合set的方法和操作
方法和操作 | 描述 |
s.add(item) | 添加item |
s.clear() | 清空集合s |
s.difference_update(t) | 在s中删除同时在s和t中的项目 |
s.discard(item) | 删除item |
s.pop() | 弹出任一项 |
s.remove(item) | 删除item,没有则引发异常 |
s.update(t) | 将t中所有项添加到t中,t为任意支持迭代对象 |
写完收工。。。
|