您当前的位置: 首页 >  数据挖掘

Better Bench

暂无认证

  • 3浏览

    0关注

    695博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

【数据挖掘】滴滴公司数据挖掘工程师笔试题

Better Bench 发布时间:2022-08-07 13:09:49 ,浏览量:3

1 选择题

1、Lm19980107【单选】下面哪种算法会导致信息不可还原?C A、RSA B、DES C、SHA1 D、LZ77

SHA1用于Hash,不可还原。

RSA、DES、LZ77都用于数据加密或压缩,均可还原。

2、下面函数的输出结果是(C) void func() { int k = 1^(1 > 31); printf(“%d\n”, k); } A、0 B、-1 C、-2 D、1

解析:右移运算左侧补符号位; 补码转源码:补码减1;除符号位全部取反

int int 为有符号整数,以 32 位存储,因此1的二进制表示为:

00000000` `00000000` `00000000` `00000001

131 将所有数整体向右移31位,左侧补符号位数字。即:

11111111` `11111111` `11111111` `11111111

1^() 异或运算,得

11111111` `11111111` `11111111` `11111110

此时符号位为1,代表次数为负数。因为计算机中加减运算使用的都是补码,所以不能直接将补码形式二进制数通过除二取余法转换为十进制数。要先将补码转换为原码,再通过除二取余法转换为十进制数。

负数补码转换为原码步骤:

  1. 补码-1,得反码:

    11111111 11111111 11111111 11111101

  2. 反码除符号位其余位取反,得原码:

    10000000 00000000 00000000 00000010

最后,将原码使用除二取余法转换为十进制数,为-2。

3、下面哪个SQL语句可以查询出“id存在于A表中,但不存在于B表”的数据? B A、 select A.* from A join B on A.id=B.id where B.id is null; B、 select A.* from A left outer join B on A.id=B.id where B.id is null; C、 select A.* from A right outer join B on A.id=B.id where B.id is null; D、 select A.* from A inner join B on A.id=B.id where B.id is null;

4、已知一棵二叉树,如果先序遍历的节点顺序是:ADCEFGHB,中序遍历是:CDFEGHAB,则后序遍历结果为()D A、 CFHGEBDA B、 CDFEGHBA C、 FGHCDEBA D、CFHGEDBA

5、在64位操作系统上,下面程序返回什么结果:D

int main() {
    int *k[10][30];
    printf(""%d\n"", sizeof(k));
    return 0;
}

A、 4 B、 8 C、 1200 D、 2400

解析:int k,表示的是指针数组,一共有1030=300个元素。在64位系统下,每个指针的长度是8字节,因此总长度为2400字节

6、以下哪些方法不适合用来对特征分布进行分析?D A、 PCA B、IsoMap C、 LLE D、 KNN

解析:PCA(principle component analysis),即主成分分析法,是一个非监督的机器学习算法,是一种用于探索高维数据结构的技术,主要用于对数据的降维,通过降维可以发现更便于人理解的特征,加快对样本有价值信息的处理速度,此外还可以应用于可视化(降到二维)和去噪。

Isomap(Isometric Feature Mapping)是流行学习的一种,用于非线性数据降维,是一种无监督算法。

LLE(Locally Linear Embedding)算法,即局部线性嵌入算法。 该算法是针对非线性信号特征矢量维数的优化方法,这种维数优化并不是仅仅在数量上简单的约简,而是在保持原始数据性质不变的情况下,将高维空间的信号映射到低维空间上,即特征值的二次提取 。

7、以下不属于优化求解方法的是?C A、 L-BFGS B、 SGD C、 ReLu D、模拟退火

解析:L-BFGS是解无约束非线性规划问题最常用的方法,具有收敛速度快、内存开销少等优点,在机器学习各类算法中常有它的身影。 简单的说,L-BFGS和梯度下降、SGD干的同样的事情,但大多数情况下收敛速度更快,这点在大规模计算中很重要。

8、ROC曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣。对于模型的 ROC 曲线,与哪一点越接近,表明该分类器的性能越好?B 左上,即TPR=0, FPR=1 左上,即FPR=0, TPR=1 右下,即TPR=0, FPR=1 右下,即FPR=0, TPR=1

9、在0到1之间随机选择3个小数,他们的和小于1的概率是?D

A、1/2 B、1/3 C、1/4 D、1/6

解析:设所取的三个数分别为 x、y、z , 则 0

关注
打赏
1665674626
查看更多评论
立即登录/注册

微信扫码登录

0.2020s