一、单选题
1、我们有很多瓶无色的液体,其中有一瓶是毒药,其它都是蒸馏水,实验的小白鼠喝了以后会在5分钟后死亡,而喝到蒸馏水的小白鼠则一切正常。现在有5只小白鼠,请问一下,我们用这五只小白鼠,5分钟的时间,能够检测多少瓶液体的成分() a 5瓶 b 6 c 31 d 32 2、若某链表最常用的操作是在最后一个结点之后插入一个结点和删除最后一个结点,则采用()存储方式最节省时间? A 单链表 B 带头结点的非循环双链表 C 带头节点的双循环链表 D 循环链表 3、如果需要对磁盘上的1000W条记录构建索引,你认为下面哪种数据结构来存储索引最合适?() A Hash Table B. AVL-Tree C. B-Tree D. List 4、可用来检测一个web服务器是否正常工作的命令是() A ping B tracert C. telnet D. ftp 5、下面哪个操作是Windows独有的I/O技术() A. Select B.Poll C.IOCP D. Epoll 6、IPV6地址包含了()位 A. 16 B. 32 C. 64 D.128 7、数据库里建索引常用的数据结构是() A 链表 B队列 C 树 D 哈希表 8、在公司局域网上ping www.taobao.com没有涉及到的网络协议是() A. ARP B. DNS C. TCP D. ICMP 二、填空题 1、http属于()协议,ICMP属于()协议 2、深度为k的完全二叉树至少有()个结点,至多有()个结点 3、字节为6位的二进制有符号整数,其最小值是() 4、设有28盏灯,拟公用一个电源,则至少需有4插头的接线板数()个。 三、综合题 1、有一颗结构如下的树,对其做镜像反转后如下,请写出能实现该功能的代码。注意:请勿对该树做任何假设,它不一定是平衡树,也不一定有序。 1 1 / | \ / | \ 2 3 4 4 3 2 /|\ /\ | | / \ / | \ 6 5 7 8 9 10 10 9 8 7 5 6 2、假设某个网站每天有超过10亿次的页面访问量,出于安全考虑,网站会记录访问客户端访问的ip地址和对应的时间,如果现在已经记录了1000亿条数据,想统计一个指定时间段内的区域ip地址访问量,那么这些数据应该按照何种方式来组织,才能尽快满足上面的统计需求呢,设计完方案后,并指出该方案的优缺点,比如在什么情况下,可能会非常慢? 四、附加题 1、写出C语言的地址对齐宏ALIGN(PALGNBYTES),其中P是要对齐的地址,ALIGNBYTES是要对齐的字节数(2的N次方),比如说:ALIGN(13,16)=16 2、在高性能服务器的代码中经常会看到类似这样的代码: typedef union { erts_smp_rwmtx_t rwmtx; byte cache_line_align_[ERTS_ALC_CACHE_LINE_ALIGN_SIZE(sizeof(erts_smp_rwmtx_t))]; }erts_meta_main_tab_lock_t; erts_meta_main_tab_lock_t main_tab_lock[16]; 请问其中用来填充的cache_line_align的作用是? 3、在现代web服务系统的设计中,为了减轻源站的压力,通常采用分布式缓存技术,其原理如下图所示,前端的分配器将针对不同内容的用户请求分配给不同的缓存服务器向用户提供服务。 分配器 / | \ 缓存 缓存 ...缓存 服务器1 服务器2 ...服务器n 1)请问如何设置分配策略,可以保证充分利用每个缓存服务器的存储空间(每个内容只在一个缓存服务器有副本) 2)当部分缓存服务器故障,或是因为系统扩容,导致缓存服务器的数量动态减少或增加时,你的分配策略是否可以保证较小的缓存文件重分配的开销,如果不能,如何改进? 3)当各个缓存服务器的存储空间存在差异时(如有4个缓存服务器,存储空间比为4:9:15:7),如何改进你的策略,按照如上的比例将内容调度到缓存服务器? 解答:
一、单选题
1) C ,海明码纠错原理,本题有r位(5位)监督位可用,根据海明码需要满足的关系式 2^r ≥ n+1,其中n是待检测的信息位数,得出 n ≤ 2^5 - 1 ,即 n ≤ 31,选C 2)C,只有C能在O(1)时间内满足题目中要求的“在最后一个结点之后插入一个结点和删除最后一个结点”,C答案最省时间 3)C,B-Tree 常被文件系统用来组织文件索引 4)C,只有C可以测试Web主机的网页服务器是否工作正常,假设该服务器的网页服务器使用的是默认端口,则可以使用命令 telnet hostname 80 来测试其是否工作 5)C,肯定不是AB,因为AB在Unix-like中有 6)D,常识 7)C,应该指B+树 8)C,DNS是将域名www.taobao.com映射成主机的IP地址,ARP是将IP地址映射成物理地址,ICMP是报文控制协议,由路由器发送给执行ping命令的主机,而一个ping命令并不会建立一条TCP连接,故没有涉及TCP协议 二、 1)应用层、网络层 2)2^(k-1)、2^k-1 3) -32 (用补码) 4) 9 三、综合题 第 1) 题
1.递归函数没有出口,栈溢出 2.交换的时候只考虑到左右子树的交换,中间子树没有考虑 3.应该先交换再调用递归函数,这样逻辑更合理 个人意见,仅供参考~ 第 2) 题 (个人观点) 用B+树来组织,非叶子节点存储(某个时间点,页面访问量),叶子节点是访问的IP地址。这个方案的优点是查询某个时间段内的IP访问量很快,但是要统计某个IP的访问次数或是上次访问时间就不得不遍历整个树的叶子节点。 什么意思,是看一段时间的访问量还是一段时间内某个IP的访问量.
将一天划分成24*60个区间,将每条数据根据其访问时间累加到相应区间里,之后要哪一段就累加一遍,如果想看某段时间某个IP的访问量,那就是每个区间里做一个IP->访问量的哈希. 四、
1.个人觉得应该写成(向后对齐):
#define ALIGN(P, AIGNBYTES) ( ((unsigned long)P + AIGNBYTES - 1) & ~(AIGNBYTES - 1) ) 2.利用union的特性,看到cache_line_align的大小已经扩展到sizeof(erts_smp_rwmtx_t) 向上对齐了,这样寻址都是sizeof(long)的倍数地址上,寻址快,有利于下边数组erts_meta_main_tab_lock_t main_tab_lock[16];的访问速度。
附件题最后一道可以参考Amazon的Dynamo分布式策略,采用虚拟节点分配的思想。 |
|
来自: wuaiz > 《数据结构/算法/面试笔试》