python - 如何匹配文本每个单词在另一个文本中的单词,及该单词对应的值?
巴扎黑
巴扎黑 2017-06-30 09:54:38
[Python讨论组]

文本ttt.txt内容:
president said would bill program loan farmers
corn committee department agriculture
usda house
文本sss.txt内容:
Topic 0th:

said   0.045193
would   0.028879
bill   0.011087
program   0.010718
loan   0.008395
farmers   0.008237
corn   0.008078
committee   0.007022
department   0.006811
agriculture   0.006653
usda   0.006547
house   0.006494
president 

Topic 1th:

said   0.044315
shares   0.031928
stock   0.028001
company   0.023888
group   0.017063
offer   0.016408
share   0.016268
dlrs   0.016034
corp   0.015520
common   0.013463
president  0.000047

如何在sss中匹配ttt中每个单词分别在2个主题下的单词及对应的值?

巴扎黑
巴扎黑

全部回复(1)
我想大声告诉你

# coding: utf8

result = {}
with open('ttt.txt') as f_t, open('sss.txt') as f_s:
    key_set = set(f_t.read().split())     # 将ttt的每个单词存到key集合
    topic = ''
    for line in f_s:
        if line.startswith('Topic'):      # 储存每个Topic
            topic = line.strip()
            result[topic] = {}

        else:
            line_split = line.split()
            if len(line_split) < 2:
                line_split.append('None')  # 防止没有值的key
            key, value = line_split

            if key in key_set:            # 如果第一列在key集合内 就收集值
                result[topic].update({
                    key: value
                })
print(result)
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号