昨天的一个面试题：如何从存放在A和B中的一亿条URL中找出A中有而B中没有的URL - - ITeye博客

`

olylakers

浏览: 261241 次
性别:
来自: 杭州

最近访客更多访客>>

sp42

Tension1900

呆呆DE萌萌

lp164042318

博主相关

博客

微博

相册

收藏

留言

关于我

博客专栏

: Redis代码阅读
浏览量：22804

文章分类

社区版块

存档分类

最新评论

sp42：可否处理下排版？
由一个UndeclaredThrowableException带来的思考
sp42：可否处理下排版？
异常处理经验小结之二：利用Spring AOP将check exception 转化为unchecked exception
sp42：谢谢
异常处理经验小结之一：不要直接抛出InvocationTargetException
unflynaomi：我也是这个原因，大赞！！！！
虚拟机ubuntu为什么不能上网?
1234abc：谢谢分享，很好的实例，赞一个
一个“诡异”的NumberFormatException

昨天的一个面试题：如何从存放在A和B中的一亿条URL中找出A中有而B中没有的URL

博客分类：

面试相关

面试数据结构

阅读更多

A和B中各存放着一亿条不重复的URL，URL存放时无序的，且URL是没有特征的，A和B可以试任意数据结构，也可以是存在数据库中。

如何找出A中有而B中没有的URL。

我当时给出的思路是：

依次遍历A和B，把从A和B里取出来的URL进行hashcode变换，把每条URL转换成key。相同的URL转换成相同的hashcode，然后用这个hashcode充当数组的下标或者map的key，数组的元素或map的value就是URL在A和B中的出现次数。

当时面试官说这是个可行的办法之一。所以我觉得应该还有更好的办法，因为要把url做 hashcode，而且要做到不冲突，那么需要的数字就要很大很大。。。就算是用byte数组或者boolean数组来存放在URL在A和B中的出现次数，所需内存也很可观。

大家一起讨论下。。。。

分享到：

JavaScript知识拾遗：如何获取动态表格中se ...

2010-09-28 11:12
浏览 1718
评论(1)
分类:非技术
查看更多

评论

1 楼 shansun123 2011-05-11

如果在查找时可用内存有限且准确度不要求太高的话，我觉得可以尝试用Bloom Filter。

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

面试题：把a.txt、b.txt文件合并写到c.txt文件: 最近做到的面试题，绝对路径下既有文件又有文件夹下的文件，需要拆分合并字符，一个简单程序demo，普通java类写的

c++面试题面试题面试题面试题: c++面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试题面试...

Android面试题-Activity A跳转Activity B，再按返回键，生命周期执行的顺序？: 最近在准备面试，碰到这一题 Activity A跳转Activity B，再按返回键，A、B的生命周期执行顺序是什么？当听到这个题目的时候，我得意地笑了笑，对于Activity的生命周期已经记熟的我，心想，为什么不直接问Activity...

牛客大数据面试题集锦+答案，共523道，46W+字。大厂必备: 面试题总结是一个长期工作，面试不停，这份面试题总结就不会停。以后会慢慢把Java相关的面试题、计算机网络等都加进来，其实这不仅仅是一份面试题，更是一份面试参考，让你熟悉面试题各种提问情况，当然，项目部分，...

华为面试题华为面试题华为面试题华为面试题华为面试题: JAVA面试题JAVA面试题JAVA面试题JAVA面试题JAVA面试题JAVA面试题

面试大数据算法解析: 3.给定a、b两个文件，各存放50亿个url，每个url各占64字节，内存限制是4G，让你找出a、b文件共同的url? 4.在2.5亿个整数中找出不重复的整数 5.腾讯面试题：给40亿个不重复的unsigned int的整数，没排过序的，然后再...

医疗卫生面试真题：卫生类典型面试题汇总及答案.pdf: 医疗卫生面试真题：卫生类典型面试题汇总及答案...在面试中，面试技巧和面试策略是一个非常重要的方面。面试者需要表达自己的面试技巧、面试策略和面试准备方法。这可以体现面试者的职业自觉、职业发展方向和职业承诺。

前端面试题: 精选Vue面试题及答案.pdf: 前端面试题: 精选Vue面试题及答案.pdf

Vue面试题：让你在面试中游刃有余.md: Vue面试题：让你在面试中游刃有余.md

经典面试题: 2021Vue经典面试题总结(含答案).pdf: 经典面试题: 2021Vue经典面试题总结(含答案).pdf

python笔记50-面试题：交换圣诞节礼物.docx: 交换礼物我们假设有同事A，B，C，D，E，每个人都准备了一个小礼物，给礼物对应的编号1，2,3,4,5。每个同事可以随机得到一个礼物，但是不能拿到自己的。 import random ''' 交互礼物，员工ABCDE分别有礼物12345...

Python经典面试题 Python常见面试考试题目整理总结 Python面试题手册共15页.pdf: 13：有没有一个工具可以帮助查找 python 的 bug 和进行静态的代码分析？ 14：如何在一个 function 里面设置一个全局的变量？ 15：有两个序列 a,b，大小都为 n,序列元素的值任意整形数，无序；要求：通过交换 a,b 中...

C/C++程序员面试指南.杨国祥(带详细书签).pdf: 面试题15：在二元树中找出和为某一值的所有路径第11章排序 11.1 插入排序面试题1：编码实现直接插入排序面试题2：编码实现希尔（Shell）排序 11.2 交换排序面试题3：编码实现冒泡排序面试题4：编码实现快速...

Java 最常见 200+ 面试题全解析：面试必备208题: Java 最常见 200+ 面试题全解析：面试必备208题

10万字总结java面试题和答案(八股文之一)Java面试题指南: Java中的IO与NIO面试题 Java反射面试题 Java序列化面试题 Java注解面试题多线程&并发面试题 JVM面试题 Mysql面试题 Redis面试题 Memcached面试题 MongoDB面试题 Spring面试题 Spring Boot面试题 Spring Cloud面试题...

经典面试题：最长公共子序列.html: 经典面试题：最长公共子序列.html

2021最新大厂AI面试题：107题（含答案及解析）.pdf: 2021最新大厂AI面试题：107题（含答案及解析）.pdf

网络工程师面试题：学习和找工作的好资料: 网络工程师面试题：一个学习和找工作的好灯塔

牛B面试题牛B面试题: 牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题牛B面试题

牛客大数据面试题集锦+答案，共523道，46W+字面试题总结一网打尽: 面试题总结是一个长期工作，面试不停，这份面试题总结就不会停。以后会慢慢把Java相关的面试题、计算机网络等都加进来，其实这不仅仅是一份面试题，更是一份面试参考，让你熟悉面试题各种提问情况，当然，项目部分，...

Global site tag (gtag.js) - Google Analytics