博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Whoosh 原理与实战1--Python 搜索框架 Whoosh 简介
阅读量:6670 次
发布时间:2019-06-25

本文共 445 字,大约阅读时间需要 1 分钟。

hot3.png

       Whoosh 是一个纯 Python 编写的搜索框架,类似于Lucene。比较简单,可以快速构建站内搜索。也可以在此基础上构建搜索引擎,但需要自己扩展 爬虫Spider 和 中文分词组件。

Whoosh详细可以查看

      最近构思了一个个人网站,准备采用 Python 开发,主要看重 Python 快速构建能力(当然,我不太会 Python,这也算一个 Python的学习作品,开发不一定快哈)。网站初步包括新闻、博客、社区,这三个版块需要站内搜索;同时有一个资讯版块,需要构建一个主题搜索引擎。这里都采用 Whoosh 作为基础,然后自己实现 Spider、中文分词完成。

下面将逐步介绍:

1. Whoosh 原理与实战

2. Python 中文分词设计与开发

3. Spider 设计与开发

由于需要边学习边写作,这只能算作我的 Python学习笔记。可能一些内容不太准确、合理,希望大家指正。

转载于:https://my.oschina.net/congqian/blog/88685

你可能感兴趣的文章
机器人市场机遇和挑战并存
查看>>
来看一场 AI 重建的 3D 全息世界杯比赛!
查看>>
为什么使用TypeReference
查看>>
Promise Race, 并不公平的 Race
查看>>
动态权限<三>华为小米特殊机制
查看>>
linux基本命令学习01
查看>>
Freebsd for ECS 系统盘扩容示例
查看>>
IPad分屏,当电脑第二显示屏
查看>>
kprobe原理解析
查看>>
String的线程安全
查看>>
云服务提供商告诉您云服务器对营销型网站的重要性
查看>>
前端通信:ajax设计方案(七)--- 增加请求错误监控、前端负载均衡以、请求宕机切换以及迭代问题修复...
查看>>
软硬件一体提高主链性能,「HPB芯链」想构建区块链版的云计算
查看>>
python中用string.maketrans和translate巧妙替换字符串
查看>>
全面深入认识C变量
查看>>
C语言嵌入式系统编程修炼之道——内存操作篇 原创21cnbao2005-10-19 22:06:00评论(0)...
查看>>
深思熟虑后做出的决定
查看>>
MYSQL中TIMESTAMP类型的默认值
查看>>
用C#动态创建Access数据库
查看>>
安全事件标准化
查看>>