分享

mongodb指南(翻译)(十二) - developer zone - 数据类型和约定(一) - xinghebuluo - 博客园

 myjessie123 2015-09-10
MongoDB(BSON)数据类型
除了基本的JSON类型:string,integer,boolean,double,null,array和object,mongo还使用了特殊的数据类型。这些类型包括date,object id,binary data,regular expression 和code。每一个驱动都以特定语言的方式实现了这些类型,查看你的驱动的文档来获取详细信息。
从shell中检查数据类型
在shell中,浮点型和整型被视为是标准javascript数字,因此不能将两者区分开。
> // v1.8+ shell
> x
{
'_id' : ObjectId('4dcd3ebc9278000000005158'),
'd' : ISODate('2011-05-13T14:22:46.777Z'),
'b' : BinData(0,''),
'c' : 'aa',
'n' : 3,
'e' : [ ],
'n2' : NumberLong(33)
}
> x.d instanceof Date
true
> x.b instanceof BinData
true
> typeof x
object
> typeof x.b
object
> typeof x.n
number
> typeof x.n
number
> typeof x.n2
object
> x.n2 instanceof NumberLong
true
> typeof x.c
string
时间戳数据类型
在mongodb中,BSON包含了有着特殊语义的时间戳数据类型。
时间戳被存储为64位,并在同一个mongod中保证唯一性。前面的32位是time_t值(从UTC时间到当前的秒数)。后面的32位是同一秒内操作的递增的顺序值。
mongodb对复制组oplog中字段“ts”使用时间戳数据类型作为“OpTimes”.
当为null时,时间戳有特殊语义。如果为null,并且时间戳是对象的前两个字段之一,时间戳会自动被转换为一个唯一的值。(它必须是前两个顶级字段之一是考虑到性能原因;整个文档未扫描时间戳。)
下面是一个mongo shell中的例子(v1.7.5或者更高)。
> // not one of the first 2 fields
> db.foo.insert( { x : 1, y : new Timestamp() } )
> db.foo.find()
{ '_id' : ObjectId('4d1d4ce78b1a04eeb294c098'), 'x' : 1, 'y' : { 't' : 0, 'i' : 0 } }
> // in first 2 fields, auto fill of value works
> db.foo.drop()
> db.foo.insert( { y : new Timestamp(), x : 3 } )
> // the shell displays timestamps as { t : ..., i : ... } where t is the time
> // component and i is the ordinal component
> db.foo.find()
{ '_id' : ObjectId('4d1d4cfd8b1a04eeb294c099'), 'y' : { 't' : 1293765885000, 'i' : 1 }, 'x' : 3 }
> db.foo.drop()
> for( var i = 0; i <10; i++ ) db.foo.insert({y:new Timestamp(), x : i})
>db.foo.find()
{ '_id' : ObjectId('4d1d4d178b1a04eeb294c09a'), 'y' : { 't' : 1293765911000, 'i' : 1 }, 'x' : 0 }
{ '_id' : ObjectId('4d1d4d178b1a04eeb294c09b'), 'y' : { 't' : 1293765911000, 'i' : 2 }, 'x' : 1 }
{ '_id' : ObjectId('4d1d4d178b1a04eeb294c09c'), 'y' : { 't' : 1293765911000, 'i' : 3 }, 'x' : 2 }
{ '_id' : ObjectId('4d1d4d178b1a04eeb294c09d'), 'y' : { 't' : 1293765911000, 'i' : 4 }, 'x' : 3 }
{ '_id' : ObjectId('4d1d4d178b1a04eeb294c09e'), 'y' : { 't' : 1293765911000, 'i' : 5 }, 'x' : 4 }
{ '_id' : ObjectId('4d1d4d178b1a04eeb294c09f'), 'y' : { 't' : 1293765911000, 'i' : 6 }, 'x' : 5 }
{ '_id' : ObjectId('4d1d4d178b1a04eeb294c0a0'), 'y' : { 't' : 1293765911000, 'i' : 7 }, 'x' : 6 }
{ '_id' : ObjectId('4d1d4d178b1a04eeb294c0a1'), 'y' : { 't' : 1293765911000, 'i' : 8 }, 'x' : 7 }
{ '_id' : ObjectId('4d1d4d178b1a04eeb294c0a2'), 'y' : { 't' : 1293765911000, 'i' : 9 }, 'x' : 8 }
{ '_id' : ObjectId('4d1d4d178b1a04eeb294c0a3'), 'y' : { 't' : 1293765911000, 'i' : 10 }, 'x' : 9 }
>
UTC DateTime 数据类型
按照BSON Date/Time数据类型被称为UTC DateTime 。(这里还有另一个时间戳数据类型,但是它是mongodb的一个特殊内部类型并且你不应该使用)。UTC DateTime将自Unix纪元(Jan 1, 1970)以来的毫秒数存储为一个64位整型数据。这个整数是有符号的,所以早于1970的时间都会被存储为负数。
但是,在版本1.9.1以前的mongodb将DateTime数错误的解析为无符号整数,这影响到了排序,范围查询,DateTime类型的字段的索引。当升级的时候索引不会重建。因此如果你使用低于版本1.9.1的程序在DateTime类型的字段上面建立了索引,然后升级到高于或等于版本1.9.1的程序后,有的索引将还是把日期按无符号整数排序(早于日期1970的会排到晚于或等于日期1970的之后),这会影响到排序和范围查询。要解决这个问题,你必须丢弃并重建你的索引。
国际化的字符串
mongodb支持UTF-8格式的字符串存储到对象和查询中。(特别的,BSON的字符串是UTF-8的.)
通常来说,每种语言的驱动在序列化和反序列号BSON时会将该语言的字符串转换为UTF-8。例如,java驱动在序列化时将java unicode字符串转换为UTF-8.
这意味着在大多数场合你可以高效的存储大多数的国际间的字符到mongodb的字符串。一些提醒:
mongodb正则表达式查询支持在正则表达式字符串中使用UTF-8.
当前,在一个字符串上进行sort()会使用strcmp:排序顺序可能是合理的但在国际间数据上面不是完全正确的。将来的mongodb版本可能会支持完全UTF-8排序次序。
java

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多