`

2014年阿里巴巴9月14号笔试题总结

阅读更多

参见:

http://blog.csdn.net/zhlfox2006/article/details/11854799

http://www.myexception.cn/internet/1589836.html

http://www.kaifazhe.com/programming/362042.html

第一部分 单选题

 

1. 假设把整数关键码K散列到N个槽列表,以下哪些散列函数是好的散列函数

 A: h(K)=K/N;

B: h(K)=1;

C: h(K)=K mod N;

D: h(K)=(K+rand(N)) mod N, rand(N)返回0到N-1的整数

参考答案:D

解析:

 首先,D最复杂,当然首选D。。一个好的散列函数应该尽可能的满足一致性散列假设:每个关键字都等可能地散列到m个槽位的任何一个之中去,并与其他的关键字已被散列到哪一个槽位中无关

 

    D选项使用的是随机数法+除留余数法。

  • 开放地扯法: 公式 Hi=(H(key)+di) MOD m i=1,2,...,k(k<=m-1)  其中,m为哈希表的表长。di 是产生冲突的时候的增量序列 
  • 哈希法:设计二种甚至多种哈希函数,可以避免冲突,但是冲突几率还是有的。
  • 链地址法:拉出一个动态链表代替静态顺序存储结构,可以避免哈希函数的冲突,不过缺点就是链表的设计过于麻烦,增加了编程复杂度。此法可以完全避免哈希函数的冲突。 
  • 建立一个公共溢出区

2. 下面排序算法中,初始数据集的排列顺序对算法的性能无影响的是:

A: 堆排序 B:插入排序

C: 冒泡排序 D:快速排序

参考答案:

解析:

(1)堆排序的时间复杂度一直都是O(nlogn),不稳定

(2)插入排序在初始有序情况下,时间复杂度为O(n),平均时间复杂度为O(n^2),稳定排序

(3)冒泡排序在初始有序的情况下,增加交换标示flag可将时间复杂度降到O(n),稳定排序

(4)快速排序在初始有序的情况下,可能会退化到 O(n^2),不稳定排序

 

  • 插入排序:最优时间复杂度On)最差时间复杂度On^2)平均时间复杂度On^2
  • 冒泡排序:最优时间复杂度On)最差时间复杂度On^2)平均时间复杂度On^2
  • 快速排序:最优时间复杂度Onlogn)最差时间复杂度On^2)平均时间复杂度Onlogn
  • 堆排序:最优时间复杂度Onlogn)最差时间复杂度Onlogn)平均时间复杂度Onlogn))

3. 下面说法错误的是:

 

A: CISC计算机比RISC计算机指令多

B: 在指令格式中,采用扩展操作码设计方案的目的是为了保持指令字长不变而增加寻址空间

C:增加流水线段数理论上可以提高CPU频率

D:冯诺依曼体系结构的主要特征是存储程序的工作方式

 

参考答案:B

解析:(1)CISC复杂指令集,RISC精简指令集,从名字上就可以得出A正确

(2)指令操作码分为三种:定长操作码,霍夫曼操作码和扩展操作码,采用扩展操作码可以使得指令字长不变的情况下,而增加指令操作的数量;

(3)流水线设计可最大限度地利用了CPU资源,使每个部件在每个时钟周期都在工作,从而提高了CPU的运算频率。CPU采用级数更多的流水线设计可使它在同一时间段内处理更多的指令,有效提高其运行频率。

(4)冯 诺依曼体系结构的主要特点:存储程序控制(要求计算机完成的功能,必须事先编制好相应的程序,并输入到存储器中,计算机的工作过程是运行程序的过程);程 序由指令构成,指令和数据都用二进制表示;指令由操作码和地址码构成;机器以cpu为中心

 

4. 不属于冯诺依曼体系结构必要组成部分是:

 

A:CPU B: Cache C:RAM D:ROM

 

参考答案:应该是选cache

解析:

冯诺依曼体系结构必要组成部分:运算器、控制器、存储器、输入设备、输出设备,Cache属于缓存了

 

5. 一个栈的入栈序列式ABCDE则不可能的出栈序列是:

 

A:DECBA  B:DCEBA  C:ECDBA  D:ABCDE

 

参考答案:C

 

6.你认为可以完成编写一个C语言编译器的语言是:

 

A:汇编 B:C语言 C:VB D:以上全可以

 

参考答案:我认为选D,

解析:

编译器的目的就是把编程语言编译成为汇编语言或者机器语言,主要是词法分析,语法分析,语义分析,编译原理这门课程的时候曾经用c语言实现过编译器的部分功能,而设想没有c语言,那么第一c程序跑起来的编译器肯定用汇编语言写的,所以应该是全部

 

7. 关于C++/JAVA类中的static成员和对象成员的说法正确的是:

 

A:static成员变量在对象构造时候生成

 

B: static成员函数在对象成员函数中无法调用

 

C: 虚成员函数不可能是static成员函数

 

D: static成员函数不能访问static成员变量

 

参考答案:C

A:static成员变量在类的定义时初始化,不可以在对象的构造函数中初始化

       B:static成员函数在对象成员函数中可以调用,同属于一个类作用域

       C:static成员函数不可以声明为const和virtual

       D:static成员函数只能访问static成员变量

 明出处:csdn-zhlfox2006

8:

 

 

参考答案:C,13个

解析:

从A到Z的最短路径一定会有两条竖线

只看竖线组合
路线不能往回走
看上面的四条竖线
第一条,下面4条竖线都可以选择,有4种走法
第二条,有4种
第三条,有3种
第四条,有2种 
4+4+3+2=13

9:某进程在运行过程中需要等待从磁盘上读入数据,此时进程的状态将:

 

A: 从就绪变为运行  B:从运行变为就绪

 

C: 从运行变为阻塞  D:从阻塞变为就绪

 

参考答案:

 

解析:
  • 运行状态(Running):进程占用处理器资源;处于此状态的进程的数目小于等于处理器的数目。在没有其他进程可以执行时(如所有进程都在阻塞状态),通常会自动执行系统的空闲进程。
  • 就绪状态(Ready):进程已获得除处理器外的所需资源,等待分配处理器资源;只要分配了处理器进程就可执行。就绪进程可以按多个优先级来划分队列。例如,当一个进程由于时间片用完而进入就绪状态时,排人低优先级队列;当进程由I/O操作完成而进入就绪状态时,排入高优先级队列
  • 阻塞状态(Blocked):当进程由于等待I/O操作或进程同步等条件而暂停运行时,它处于阻塞状态

10:下面算法的时间复杂度为:

 

Int f(unsigned int n)
{

 

If(n==0||n==1)

 

Return 1;

 

Else 

 

Return n*f(n-1);

 

}

 

A: O(1)   B:O(n)  C:O(N*N)  D:O(n!)

 

参考答案:B,题目算得是n!,但是复杂度确实O(n)

 

11: n从1开始,每个操作可以选择对n加1或者对n加倍。若想获得整数2013,最少需要多少个操作。

 

A:18    B:24   C:21  D;不可能

 

参考答案: A,18 个完美解决,方法也很简单,尽量对2013用除法,显示 2013->2012->1006->503->502->251->250->125->124->62->31->30->15->14->7->6->3->2->1

 

正向只能是+1和×2,所以逆向只能-1和/2,由上过程可得18次

 

12:对于一个具有n个顶点的无向图,若采用邻接表数据结构表示,则存放表头节点的数组大小为:

 

A: n  B: n+1    C: n-1   D:n+边数

 

参考答案:

 图的邻接表表示

   

13:

 

 

参考答案:对于集合中的每个字符串取hash可以看作是同分布的独立重复事件,所以每一个事件出现10的概率都是p=1/1024,那么当出现的时候,期望的次数就是1/p,1024.

 

14:如下函数,在32bit系统foo(2^31-3)的值是:

 

Int foo(int x)
{

 

Return x&-x;

 

}

 

A: 0   B: 1  C:2  D:4

 

参考答案:C,首先-号比^的优先级高,所以实参应该是2^28,而C++中并没有幂指数的运算符,这个^只表示异或运算,所以实参的二进制值,

 

x的值为  0000 0000, 0000 0000, 0000 0000,0001 1110

 

负数在内存中存取方式是绝对值取反再加1;所以:

 

 -x 的值为 1111 1111, 1111 1111, 1111 1111, 1110 0010

 

 x&-x: 0000 0000, 0000 0000, 0000 0000,0000 0010

 

即为2。

 

所以答案为C

 

15:对于顺序存储的线性数组,访问节点和增加节点删除节点的时间复杂度为:

 

A: O(n),O(n)     B:O(n),O(1)      C:O(1),O(n)      D:O(n),O(n)

 

参考答案:C

访问节点只需根据索引值访问即可;增加删除节点时,涉及到节点的移动(除非是在末尾的操作)

 

16:在32为系统环境,编译选项为4字节对齐,那么sizeof(A)和sizeof(B)是:

 

Struct A
{

Int a;

short b;

int c;

char d;

 };

 

Struct B
{

int a;

short b;

char c;i

nt c;

};

 

A: 16,16    B:13,12   C:16,12 D:11,16

 

参考答案:C

内存对齐,A中b和c各占一个4字节,B中b和c占用一个4字节。

 

17:袋中有红球,黄球,白球各一个,每次任意取一个放回,如此连续3次,则下列事件中概率是8/9的是:

 

A: 颜色不全相同 B:颜色全不相同C:颜色全相同D:颜色无红色

 

参考答案:A

 

解析:

 

颜色不全相同:1 - ( 1/3 * 1/3 * 1/3 ) * 3 = 8/9

 

颜色全不相同:1/3 * ( 1 - 1/3 ) * ( 1 - 1/3 - 1/3 ) = 2/9

 

颜色全相同:    ( 1/3 * 1/3 * 1/3 ) * 3 = 1 /9

 

颜色无红色:    ( 1 - 1/3 ) * ( 1 - 1/3 ) * ( 1 - 1/3 ) = 8/27

 

18:一个洗牌程序的功能是将n张牌的顺序打乱,以下关于洗牌程序的功能定义说法最恰当的是:

 

A: 每张牌出现在n个位置上的概率相等

 

B: 每张牌出现在n个位置上的概率独立

 

C: 任何连续位置上的两张牌的内容独立

 

D: n张牌的任何两个不同排列出现的概率相等

 

参考答案:A

 

解释,创新工场笔试题让设计一个shuffle算法的时候就是特意提到,每张牌出现在任意位置的概率相等。

 

19:用两种颜色去染排成一个圈的6个棋子,如果通过旋转得到则只算一种,一共有多少种染色:

 

A: 10 B:11 C:14: D:15

 

参考答案:C

 

解释:应该有14种方案,设只有黑白两色,默认白色,那么,用p(n)表示有n个黑棋的种类

 

p(0)=p(6)=1

 

p(1)=p(5)=1

 

p(2)=p(4)=3 //相邻的一种,隔一个的一种,两个的一种

 

p(3)=4 //都相邻的一种,BB0B的一种,BB00B的一种,B0B0B的一种,一共4种

 

综上是14种

 

20:递归式的先序遍历一个n节点,深度为d的二叉树,则需要栈空间的大小为:

 

A: O(n) B:O(d)  C:O(logn)  D:(nlogn)

 

参考答案:B 

 

解释:根节点访问到叶子节点后就回溯了。所以所需要栈的最大空间为树的深度。

因为二叉树并不一定是平衡的,也就是深度d!=logn,有可能d》》logn。。所以栈大小应该是O(d)

 

第二部分:多选

 

21:两个线程运行在双核机器上,每个线程主线程如下,线程1:x=1;r1=y;线程2:y=1;r2=x;

 

X和y是全局变量,初始为0。以下哪一个是r1和r2的可能值:

 

A: r1=1,r2=1

 

B: r1=1,r2=0

 

C:r1=0,r2=0

 

D:r1=0,r2=1

 

参考答案:ABD

解析:语句执行顺序组合,但是线程内的子句顺序不可变

 

22.关于Linux系统的负载,以下表述正确的是:

 

A: 通过就绪和运行的进程数来反映

 

B: 通过TOP命令查看

 

C: 通过uptime查看

 

D: Load:2.5,1.3,1.1表示系统的负载压力在逐渐变小

 

参考答案:BC

 

 23:关于排序算法的以下说法,错误的是:

 

A: 快速排序的平均时间复杂度O(nlogn),最坏O(N^2)

 

B:堆排序平均时间复杂度O(nlogn),最坏O(nlogn)

 

C:冒泡排序平均时间复杂度O(n^2),最坏O(n^2)

 

D:归并排序的平均时间复杂度O(nlogn),最坏O(n^2)

 

答案: D

解释:归并排序的平均时间复杂度O(nlogn),最坏O(nlogn)

 

24:假设函数rand_k会随机返回一个【1,k】之间的随机数(k>=2),并且每个证书出现的概率相等。目前有rand_7,通过调用rand_7()和四则运算符,并适当增加逻辑判断和循环控制逻辑,下列函数可以实现的有:

 

A:rand_3 B:rand_21  C:rand_23  D:rand_47

 

 参考答案:ABCD

 

解释,对于rand_x(x<7)的直接截断,只要 rand数大于x直接忽略,保证rand_x能够做到概率相等。而对于其他的则采用7×rand_7+rand_7,可以-7得到rand_49,然后截 断成rand_42,统一除以2,则是rand_21,其他类似。多谢@plylw456 提醒。

 

鉴于大家对这道题的解释看得不太清,我就在此展开解释一下:

 

首先分析:7×rand_7+rand_7

 

1.      首先它是由两个随机变量组成,亦即7X+Y,只不过X与Y是独立同分布的而已,所以上式子表示为Z=7X+Y

 

那么对于随机变量X,你可以理解为它是一个“量级”的概念,X取值为1~7

 

当X=1时,随机变量Z取值范围是1*7+(1~7),也就是8~14

 

当X=2时,随机变量Z取值范围是2*7+(1~7),也就是15~21

 

当X=3时,随机变量Z取值范围是3*7+(1~7),也就是22~28

 

以此类推。。。

 

可以产生8~56的随机数。

 

那么产生的8~56的随机数,概率都相等吗?

 

答案是必然的,因为X是量级的概念,达到每个量级的概率是1/7,在量级内,Y达到1~7每个数的概率依然是1/7,所以8~56的每个数的概率都是1/49

 

好了我们可以得到1/49等概率的8~56,直接在生产的时候-7,得到等概率1/49的1~49.。。。。

 

好, 现在只需要记住,得到rand_49,1~49的每个数都是等概率的就可以了,因为我们要截断,也就是说,为了得到rand_23直接截断,判断输出如 果>23,直接忽略,否则输出,大家可能有点别扭,因为有的随机数生成的时候可能时间上要比其他的长点。但是要记住,1~23每个数输出的概率都是 相等的,只不过不能保证每次输出时间都分秒不差而已。时间长短是跟概率无关的概念。

 

第三部分 填空与问答

25、某二叉树的前序遍历序列为-+a*b-cd/ef,后序遍历序列为abcd-*+ef/-,问其中序遍历序列是___。

答案:a+b*c-d-e/f

 

26、某缓存系统采用LRU淘汰算法,假定缓存容量为4,并且初始为空,那么在顺序访问以下数据项的时候1,5,1,3,5,2,4,1,2出现缓存命中的次数是___。最后缓存中即将准备淘汰的数据项是___。

答案:3,5

解释:

分析:列出每一次访问数据项时,缓存的状态

1
1,5
5,1 命中
5,1,3
1,3,5 命中
1,3,5,2
3,5,2,4 超过缓存容量上限,删除1
5,2,4,1 超过缓存容量上限,删除3
5,4,1,2 命中

所以答案就出来了,直接命中次数是3,最后缓存中准备淘汰的数据项是5

 

27、两个较长的单向链表a和b,为了找出节点node满足node in a并且node in b。请设计空间使用尽量小的算法(用c/c++,java 或者伪代码)

答案:就是先分别遍历一遍链表A和链表B,在遍历时分别记下链表AB的长度,并且在最后看看链表A和链表B的最后一个节点是不是相同,如果相同则有公共节点,如果不同就没有公共节点。

找公共节点就是再利用两个指针,根据遍历时记录的长度,找到第一个公共节点,这个节点后面的就都是公共节点了。

 

28、当存储数据量超出单节点数据管理能力的时候,可以采用的办法有数据库sharding的解决方案,也就是按照一定的规律把数据分散存储在多个数据管理节点N中(节点编号为0,1,2,,,,N-1)。假设存储的数据时a  请完成为数据a计算存储节点的程序。

答案:进行一次哈希,获取节点编号即可。原题中有给出代码,很简单,这里不再给出。

 

29、宿舍内5个同学一起玩对战游戏。每场比赛有一些人作为红方,另一些人作为蓝方。请问至少需要多少场比赛,才能使任意两个人之间有一场红方对蓝方和蓝方对红方的比赛? 

 

解析:一次划分中,某方可以有1人,另一方有4人或某方有2人,另一人有3人。

要使任意两个人之间有一场红方对蓝方和蓝方对红方的比赛,假设5个同学为A,B,C,D,E,相当有有向图的5个节点,任意两个节点间有两个方向的边连接。

即总的节点关系有(5个节点中选取两个节点)A(5,2)=5*4=20个关系。

而一次比赛(一次划分)能够生成的关系(一方两人一方三人的划分)c(2,1)*c(3,1)=2*3=6或者(一方四人一方一人的划分)c(4,1)*(c(1,1)=4*1=4,

所以一场比赛(一次划分)最多生成的关系次数为6

所以需要20/6=3.33..即至少需要4场比赛

 

答案:4场,分别是AB-CDEACD-BEBCE-ADDE-ABC

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics