-
2016-10-22 16:06:39
-
2016-10-22 16:04:53
-
2016-10-22 16:02:54
- 请问一下微博和百度贴吧的热门话题排行榜是如何生成的?
- 微博和贴吧都是国内数一数二的PHP构建的高并发网站,请问他们的这个热门话题排行榜是如何得出的?我目前只想得到用中文分词库对全站内容分词和统计,但是这类高并发网站每天都是成千上亿的数据产出,用分词的话如何是如果解决效率问题的?或者他们还用了其他什么技术?
-
0
1
1035
-
2016-10-22 16:01:55
- 如何使用Python获取html上input file的文件
- 想在Python上获取到html的input file的csv文件然后再传入mysql,现在就是不知道如何获取这个选中的文件,只实现了绝对路径上的csv文件。有什么办法能获取到html上传来的文件呢?麻烦各位大神解答一下,谢谢了!
-
0
0
799
-
2016-10-22 16:01:08
-
2016-10-22 16:00:16
- pyspider scheduler 停止调度,重启时间长.
- 当前的pyspider为pyspider (0.3.9) python 2.7.5大概有200个项目,其中部分stop,运行状态大概有100多个。projectdb和resultdb 使用的是 mongodb collection有过百万的数据。某些porjectdb 的task数据也有数十万条当我修改项目的itag 然后修改项目状态为running,然后点run,显示为红色,看scheduler
-
0
1
1533
-
2016-10-22 15:59:12
- 爬虫:搜索结果要等待几秒之后才能出现,怎么爬取结果出现后的页面?
- #coding=utf-8
import sys
import requests
reload(sys)
sys.setdefaultencoding('utf-8')
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64)
-
0
1
1219
-
2016-10-22 15:56:44
-
2016-10-22 15:53:59
- tornado在同时发出n个请求时,如何让其中1个有结果就返回?
- 我知道tornado可以用如下方式,同时并发n个请求:response1, response2,... responsen = yield [http_client.fetch(url1) , http_client.fetch(url2), ...... ,http_client.fetch(url2) ]等到n个请求都响应了之后,会返回给程序控制权,那么我的问题是:1.如果我想其中一个有结果了
-
0
1
1082
-
2016-10-22 15:52:27