起名动漫:稚气的外部老成的弦外之音,你不得不敬畏又酷爱这个萝莉吸血鬼

2. 配置csft.conf文件

#MySQL数据源配置,详情请查看:http://www.coreseek.cn/products-install/mysql/
#请先将var/test/documents.sql导入数据库,并配置好以下的MySQL用户密码数据库

#源定义
source mysql
{
    type                    = mysql

    sql_host                = localhost
    sql_user                = root
    sql_pass                = 123456
    sql_db                  = test
    sql_port                = 3306
    sql_query_pre           = SET NAMES utf8 #预查询

    sql_query               = SELECT id, group_id,author_id, UNIX_TIMESTAMP(date_added) AS date_added, title, content FROM documents
                                                              #主查询-查询的数据将被索引sql_query第一列id需为整数
    sql_attr_uint           = author_id                                                          #title、content作为字符串/文本字段,被全文索引
    sql_attr_uint           = group_id           #从SQL读取到的值必须为整数
    sql_attr_timestamp      = date_added #从SQL读取到的值必须为整数,作为时间属性

    sql_query_info_pre      = SET NAMES utf8                                        #命令行查询时,设置正确的字符集
    sql_query_info          = SELECT * FROM documents WHERE id=$id #命令行查询时,从数据库读取原始数据信息

    #区段查询 每次查询一段数据来建立索引
    #sql_query_range = SELECT MIN(id),MAX(id) FROM documents
    #sql_range_step  = 1000
    #sql_query = SELECT * FROM documents WHERE id>=$start AND id<=$end    
}

#index定义
index mysql
{
    source            = mysql             #对应的source名称
    path            = C:/coreseek-3.2.14-win32/var/data/mysql/ #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
    docinfo            = extern
    mlock            = 0
    morphology        = none
    min_word_len        = 1
    html_strip                = 0

    #中文分词配置,详情请查看:http://www.coreseek.cn/products-install/coreseek_mmseg/
    #charset_dictpath = /usr/local/mmseg3/etc/ #BSD、Linux环境下设置,/符号结尾
    charset_dictpath = C:/coreseek-3.2.14-win32/etc/                             #Windows环境下设置,/符号结尾,最好给出绝对路径,例如:C:/usr/local/coreseek/etc/...
    charset_type        = zh_cn.utf-8
}

#全局index定义
indexer
{
    mem_limit            = 128M
}

#searchd服务定义
searchd
{
    listen                  =   9312
    read_timeout        = 5
    max_children        = 30
    max_matches            = 1000
    seamless_rotate        = 0
    preopen_indexes        = 0
    unlink_old            = 1
    pid_file = C:/coreseek-3.2.14-win32/var/log/searchd_mysql.pid  #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
    log = C:/coreseek-3.2.14-win32/var/log/searchd_mysql.log        #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
    query_log = C:/coreseek-3.2.14-win32/var/log/query_mysql.log #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
}

 

 详细官方文档:http://www.coreseek.cn/products-install/mysql/

  生成索引

  将MYSQL数据源中的数据查询到sphinx中,再按照配置文件csft.conf配置的索引index举办索引生成,索引一般分为主索引、增量索引和实时索引。一般20W条的MYSQL数据行生成索引的光阴为2分钟左右(indexer命令详见以上)

C:\coreseek-3.2.14-win32\bin\indexer -c C:\coreseek-3.2.14-win32\csft.conf --all

 

 

 动用API进行测试

 

 

  将api/sphinxapi.php包含到PHP文件中就足以采用API程序调用coreseek了,1000W的多寡行中,使用API调用全文检索重回的时刻<500ms,使用接口的连锁参数比如可以操纵搜索重返行数、分组排序、限制标准等,从sphinx重返ids(MYSQL数据库表中的主键),依照ids可以到MYSQL中寻觅到需要的数码。

起名 1

  一段PHP的测试代码

 

include 'sphinxapi.php';
$sp = new SphinxClient;
$sp->SetServer('127.0.0.1', 9314);
$sp->SetConnectTimeout(5);

$sp->SetLimits(0, 10);//($start, $limit);

$keyword=(isset($_GET['kw'])&& !empty($_GET['kw'])) ?trim($_GET['kw']) : '搜索内容';

//在执行搜索之前,可以加入各种条件
$result=$sp>Query($keyword,'iiyicms');//'*‘   'iiyicms:iiyicms_increment'

 

 

 

## 夏提雅(overlord及其同事小说,丸山くがね,madhouse)

  Coreseek安装

## 克鲁鲁(终结的炽天使及其同事作品,山本大和,wit studio)

  **起名 2**

男主下到迷宫100层,战胜强力怪物,然后看到一个被封印的萝莉,萝莉求男主就救他,男主此时曾经黑化,完全不信任萝莉是个无辜无助的人,萝莉只可以说出实情,原来她是吸血鬼女王,统治被人推翻落为囚犯,由于他有意的不死性,被反叛者如何折磨都不会死,所以反叛者只好将他封印在那多少个迷宫中,男主救下他,给她起名月

   Coreseek
系数襄助: FreeBSD6/7/8,Mac OS X
10.6,RHEL5、CentOS-5、Fedora-12/13、gentoo-10、openSUSE-10/11、slackware-13.0/13.1、debian-5、ubuntu-9/10、archlinux-2010,WindowsXP、Windows2003、Windows7、Windows
Server
2008等,32与64位操作系统均可使用,可协助MySQL、玛丽亚(Maria)DB、PostgreSQL、SQL
Server、Oracle等多种数据库系统,并提供Python万能数据源以帮助任意来源的数量。

萝莉吸血鬼的魅力在于,明明长着一张稚嫩未脱的脸,不过出于对友好实力的自信,真正生气的时候可以让弱小的人类感受到温馨留存的不起眼,你觉得前边的只是猫咪,然后萝莉吸血鬼会突然变老虎

  1. 安装searchd服务

终结的原油天使这部番总体是卖角色,剧情毫无逻辑,不过人设好,人物塑造上大多受人欢喜的因素都用上了,克鲁鲁是东瀛的吸血鬼女王,纯血种吸血鬼,保持萝莉姿态然则捏死生物就像捏死虫子一样,完全的抖s性格

  今天闲下来探讨了MYSQL的目录优化,继而领悟了MYSQL的全文检索,在大数据量下假诺你利用like去找寻数据库的消息的落实全文检索,那么恭喜你你会暴库。。

随便真身是何许,能吸血的就是吸血鬼,夏提雅的真身是个让最深度的死宅都不敢大喊“我有一个无畏的想法”的洗盘嘴怪物,一般形象是黑眼圈的哥特萝莉

  Coreseek介绍

真身大美丽的女生,活了500年的寄生虫,原本希望阿良良木历这么些眷属终结自己的性命,不过善良的历选取折中的方法,夺去小忍的大多数吸血鬼力量,让小忍维持幼女那个无攻击力的形象

  以下是介绍在windows下测试环境的安装(不指出把coreseek正式安排在windows),首先去官方网站下载稳定版本的安装包(3.2本子),下载后解压缩到一个文件夹,如解压缩到C盘:路径为 C:\coreseek-3.2.14-win32,以下为设置coreseek
windows版本记录

## 小忍(物语系列及其同事随笔,西尾维新 shaft)

  全文检索引擎中Sphinx是相比较可观的,但是对中文援助不是多多益善,所以就有了Coreseek,大旨是Sphinx引擎,然则对中文查找有了很好的支撑,而且有很全的国语文档,开源免费试用,襄助Windows、Linunx甚至是Mac。

## 月(平凡职业成就世界最强伙同同事随笔,厨二好き、fk,RoGa)

  常用的文书和目录

style=”color: #008000; font-size: 16px;”>  Coreseek/

  /api/

                 sphinxapi.php       #本着PHP的api,实际上是一个类

              /bin/

                      indexer.exe           #建立目录的指令

                      searchd.exe          #监听端口,开启服务的通令

         search.exe            #施行搜索命令    

         mmseg.exe          #词库相关命令

              /etc/

                      *.conf                   #安排文件

         unigram.txt          #词库文件txt

         thesaurus.txt       #同义词词库文件 txt

                         uni.lib                 
#创立索引用到的词库文件,由mmseg命令加工 
                                # unigram.txt文件形成

              /var/

                       /data/                #目录存放地方

1.  indexer一声令下参考

indexer 是Sphinx的多少个第一工具之一。不管是从命令行直接调用,仍旧作为一个较大的脚本的一片段拔取,indexer都只负责一件事情——收集要被搜寻的数目。

indexer的调用语法基本上是这般:

indexer [OPTIONS] [indexname1 [indexname2 [...]]]

用户可以在sphinx.conf中设置好或者有什么索引(index)(这一个索引可以在晚些时候别搜索),因此在调用indexer的时候,最简便易行的气象下,只需要报告它你要简历哪个(或者如何)索引就行了。

假设 sphinx.conf 包含了五个目录的现实设置, mybigindex 和 mysmallindex,
,你可以这样调用:

$ indexer mybigindex
$ indexer mysmallindex mybigindex

在布局文件sphinx.conf内部,用户可以为她们的多寡指定一个或六个目录。然后调用indexer来对内部一个特定的目录举行再一次编排索引操作,或者是再度编辑所有索引——不压制某一个或同时整个,用户总是可以指定现有索引的一个结合。

indexer的大多数摘取都得以在配备文件中提交,不过有一些取舍还亟需在命令行上点名,这些采用影响编制索引这一操作是何许进展的。那么些选取列举如下:

  • --config <file> (简写为-c <file>)
    使 indexer 将点名的文本file作为配置文件。
    平时,indexer是会在装置目录(例如e.g. /usr/local/sphinx/etc/sphinx.conf,假如sphinx被安装在/usr/local/sphinx)中寻找sphinx.conf,若找不到,则持续在用户在shell中调用indexer时所在的目录中搜索。
    那些选项一般在共享sphinx安装的情景下行使,比如二进制文件安装在/usr/local/sphinx,而不同用户都有权定制自己的sphinx设置。或者在同一个服务器上运行两个实例的情况下利用。在上述两中状态中,用户可以创立自己的sphinx.conf文本,然后把它做为参数传给indexer。例如:

    $ indexer --config /home/myuser/sphinx.conf myindex
    
  • --all 使indexersphinx.conf文件中列出的保有索引举办重新编写索引,这样就不比一回列出每个索引的名字了。这些选项在配置文件较小的气象下,或者在看似基于cron的掩护工作中很有用。在上述意况中,整个索引集每一天或每一周或别的什么适当的光阴间隔中就再一次成立两回。用法示例:

    $ indexer --config /home/myuser/sphinx.conf --all
    
  • --rotate 用于轮换索引。对新的文档建立目录时几乎肯定都保证搜索服务如故可用,除非您有信念在追寻服务截至同时不给你的用户带来麻烦。--rotate确立一个外加的目录,并列于原有索引(与原有索引在同等目录,简单地在原来索引文件名基础上加一个.new后缀)。一旦这些额外的目录建立完成,indexersearchd发一个SIGHUP信号做为通告。searchd会尝试将引得重新命名(给原来索引加上.old后缀,而把带有.new后缀的新索引改为原名,以达替换之目标),继而用新的文书重启服务。依 seamless_rotate 选项设定之不同,在新索引可用往日恐怕有一点小的延迟。用法示例:

    $ indexer --rotate --all
    
  • --quiet 使indexer不出口除错误(error)外的其它事物。这一个选项依然拽可用在cron定时任务的田地下或者脚本中,这么些境况下大部分出口是可有可无或完全没用的,除非是暴发了某些项目的荒谬。用法示例:

    $ indexer --rotate --all --quiet
    
  • --noprogress 不随时突显速度音信,而是仅在目录截至时告诉最后的事态细节(例如为怎么样文档建立了目录,建立目录的进度等)。当脚本没有运行在一个控制台(console,或“tty”)时,那多少个选项是默认的。用法示例:

    $ indexer --rotate --all --noprogress
    
  • --buildstops <outputfile.text> <N> 像建立目录一样扫描索引对应的数据源,发生一个结尾会被投入索引的词项的列表。换种说法,爆发一个用这多少个目录可以搜寻的词项的列表。注意,这多少个选项使indexer并不着实更新指定的目录,而只是“假装”建在立索引似地拍卖两遍数据,包括运转sql_query_pre或者sql_query_post采纳指定的查询。outputfile.txt文本最后会含有一个词表,每行一个词,按词频排序,高频在前。参数N指定了列表中最多可出现的词项数据,假使N日元引中全体词项的数量还大,则赶回的词项数就是全部词项数。客户端应用程序利用这种字典式的词表来提供“您是要寻找。。。吗?(Did
    you
    mean…)”的效应,常常这么些选项与下部要讲的--buildfreqs慎选一同使用。示例:

    $ indexer myindex --buildstops word_freq.txt 1000
    

    这条命令在当前目录发生一个word_freq.txt文本,内含myindex那个目录中最常用的1000个词,且最常用的排在最前面。注意,当指定了六个索引名或应用了--all慎选(相当于列出布局文件中的所有索引名)时,这些选项对其中的最后一个索引起效率。

  • --buildfreqs 与 --buildstops同步使用
    (假使没有点名 --buildstops 则--buildfreqs起名,也被忽视).
    它给--buildstops发出的词表的每项扩大一个计数消息,即该词在目录中共出现了多少次,这在确立停用词(stop
    words,出现专门普遍的词)表时可能有用。在支付“您是要摸索。。。吗?(Did
    you
    mean…)”的效果时这么些选项也能帮上忙,因为有了它你就能知道一个词比另一个近似的词出现得更频繁的程度。示例:

    $ indexer myindex --buildstops word_freq.txt 1000 --buildfreqs
    

    本条命令将发生一个好像于上一条命令的word_freq.txt ,但不同在于,每个词的末尾都会增大一个数字,指明在指定的目录中这一个词出现了稍稍次。

  • --merge <dst-index> <src-index> 用于在情理上将多少个目录合并,比方说你在应用“主索引+增量索引”格局,主索引很少改变,但增量索引很频繁地重建,而--merge选择允许将那多少个索引合而为一。操作是从右向左举行的,即先观察src-index的始末,然后在情理中将之与dst-index统一,最终结果留在dst-index里。用伪代码说就是dst-index += src-index。示例:

    $ indexer --merge main delta --rotate
    

    上例中main是主索引,很少更动,delta是增量索引,频繁更新。上述命令调用indexer将delta的情节统一到main里面还要对索引举行轮换。

  • --merge-dst-range <attr> <min> <max> 在集合索引的时候运行范围过滤。具体地说,向目的索引
    (是 --merge 的一个参数,如若没有点名 --merge
    --merge-dst-range 也被忽视)合并时,indexer会对即将合并进去的文档做三回过滤,唯有经过过滤才能最后出现在对象索引中。举一个实用的例证,固然某个索引有一个“已去除(deleted)”属性,0代表“尚未删除”。那样一个目录可以用如下命令举行联合:

    $ indexer --merge main delta --merge-dst-range deleted 0 0
    

    如此这般标记为已删除的文档(值为1)就不会出现在新转变的靶子索引中了。这几个选项可以在命令行上点名多次,以便指定四个相继的过滤,这样一个文档要想合并到终极的靶子索引中去,就亟须逐一通过总体这一个过滤。

2.  searchd指令参考

searchd 也是sphinx的六个至关重要工具之一。 searchd是系统实际处理搜索的机件,运行时它显现得就像一种服务,他与客户端应用程序调用的各样各类的API通讯,负责接受询问、处理查询和再次回到数据集。

不同于 indexersearchd 并不是计划性用来在命令行或者一般的剧本中调用的,
相反,它仍然做为一个看护程序(daemon)被init.d调用(在Unix/Linux类系统上),或者做为一种服务(在Windows类系统上),因而并不是享有的指令行选项都接连实惠,这与构建时的精选有关。

调用 searchd 就像这样简单:

$ searchd [OPTIONS]

不管 searchd 是什么构建的,下列选项总是可用:

  • --help (可以简写为 -h )
    列出可以在你眼前的 searchd 构建上调用的参数。
  • --config <file> (可简写为 -c <file>)
    使 searchd 使用指定的配备文件,与上述indexer--config开关相同。
  • --stop 用来停掉 searchd,使用sphinx.conf中所指定的PID文件,因而你可能还需要用--config慎选来确认searchd采纳哪个配置文件。值得注意的是,调用 --stop 会确保用 UpdateAttributes() 对索引举行的更动会反应到实在的目录文件中去。示例:

    $ searchd --config /home/myuser/sphinx.conf --stop
    
  • --status 用来询问运行中的searchd实例的气象,,使用指定的(也得以不点名,使用默认)配置文件中描述的总是参数。它经过安排好的首先个UNIX套接字或TCP端口与运行中的实例连接。一旦连续成功,它就询问一多样情景和性能计数器的值并把这多少个数量打印出来。在应用程序中,可以用Status() API调用来拜会同一的这多少个计数器。示例:

    $ searchd --status
    $ searchd --config /home/myuser/sphinx.conf --status
    
  • --pidfile 用来显式指定一个PID文件。PID文件存储着有关searchd的经过信息,那个音信用于进程间通讯(例如indexer需要了然这一个PID以便在轮换索引的时候与searchd进展报道)searchd在例行模式运行时会使用一个PID(即不是行使–console选项启动的),但有可能存在searchd在控制台(--console)情势运作,而还要正在索引正在举行更新和更替操作的动静,此时就需要一个PID文件。

    $ searchd --config /home/myuser/sphinx.conf --pidfile /home/myuser/sphinx.pid
    
  • --console 用来强制searchd以控制台形式启动;典型气象下searchd像一个价值观的服务器应用程序这样运行,它把音讯输出到(sphinx.conf布局文件中指定的)日志文件中。但多少时候需要调剂配置文件或者守护程序本身的题材,或者诊断一些很难跟踪的题目,这时强制它把信息一向出口到调用他的控制台或者命令行上会使调试工作容易些。同时,以控制台形式运作还代表进程不会fork(由此搜索操作都是串行执行的),也不会写日记文件。(要特别注意,searchd并不是被重点设计用来在控制台格局运作的)。可以如此调用searchd

    $ searchd --config /home/myuser/sphinx.conf --console
    
  • --iostats 当使用日志时(必须在sphinx.conf中启用query_log选项)启用--iostats会对每条查询输出关于查询过程中生出的输入输出操作的详细信息,会带动一线的特性代价,并且众所周知会招致更大的日记文件。更多细节请参考 query
    log
    format
     一节。可以这么起步searchd

    $ searchd --config /home/myuser/sphinx.conf --iostats
    
  • --cpustats 使实际CPU时间告诉(不光是实在度量时间(wall
    time))出现在询问日志文件(每条查询输出一回)和情状报告(累加其后)中。这么些选项依赖clock_gettime()系统调用,由此可能在某些系统上不可用。可以如此起步searchd

    $ searchd --config /home/myuser/sphinx.conf --cpustats
    
  • --port portnumber (可简写为 -p)
    指定searchd监听的端口,平常用于调试。这一个选项的默认值是9312,但偶尔用户需要它运行在此外端口上。在那多少个命令行选项中指定端口比配置文件中做的另外设置优先级都高。有效的端口范围是0到65535,但要使用低于1024的端口号可能需要权限较高的账户。使用示例:

    $ searchd --port 9313
    
  • --index <index> 强制searchd只提供针对性指定索引的追寻服务。跟下面的--port一致,这首如果用以调试,如倘使漫长选取,则应当写在配置文件中。使用示例:

    $ searchd --index myindex
    

searchd在Windows平台上有一些蓄意的选项,与它做为windows服务所发生的附加处理有关,这一个接纳只存在于Windows二进制版本。

注意,在Windows上searchd默认以--console情势运行,除非用户将它安装成一个劳务。

  • --install 将searchd安装成一个微软保管控制台(Microsoft
    Management Console, 控制面板 / 管理工具 /
    服务)中的服务。假若一条命令指定了--install,那么与此同时选拔的其它具备选项,都会被保存下来,服务安装好后,每便启动都会调用这一个命令。例如,调用searchd时,我们很可能希望用--config点名要运用的配置文件,那么在应用--install的还要也要进入这些选项。一旦调用了这多少个选项,用户就足以在控制面板中的管理控制杜阿拉对searchd进行启动、截至等操作,因此总体可以开端、为止和重启服务的措施对searchd也都灵验。示例:

    C:\WINDOWS\system32> C:\Sphinx\bin\searchd.exe --install
       --config C:\Sphinx\sphinx.conf
    

    假设每一次启动searchd您都愿意赢得I/O
    stat消息,这就应有把这么些选项也用在调用--install的指令行里:

    C:\WINDOWS\system32> C:\Sphinx\bin\searchd.exe --install
       --config C:\Sphinx\sphinx.conf --iostats
    
  • --delete 在微软保管控制台(Microsoft Management
    Console)和任何服务注册的地点删除searchd,当然在此之前要已经通过--install安装过searchd劳动。注意,这么些选项既不删除软件本身,也不删除任何索引文件。调用这一个选项之后只是使软件提供的服务不能从windows的劳务连串中调用,也不可以在机械重启后自动启动了。即便调用时searchd正在做为服务运作中,那么现有的言传身教并不会被终止(向来会运行到机械重启或调用--stop)。假若服务安装时(用--servicename)指定了自定义的名字,这在调用此选项卸载服务时里也亟需用--servicename指定相同的名字。示例:

    C:\WINDOWS\system32> C:\Sphinx\bin\searchd.exe --delete
    
  • --servicename <name> 在设置或卸载服务时指定服务的名字,这一个名字会产出在管理控制罗利。有一个默认的名字searchd,但若安装服务的体系或者有四个管理员登录,或同时运转三个searchd实例,那么起一个描述性强的名字将是个好好主意。注意,只有在与--install或者--delete并且拔取的时候--servicename才有效,否则那么些选项什么都不做。示例:

    C:\WINDOWS\system32> C:\Sphinx\bin\searchd.exe --install
       --config C:\Sphinx\sphinx.conf --servicename SphinxSearch
    
  • --ntservice 在Windows平台,管理控制台将searchd做为服务调用时将这个选项传递给它。平日没有必要直接调用这些开关,它是为Windows系统准备的,当服务启动时,系统把这个参数传递给searchd。然则理论上,你也得以用这多少个开关从命令行将searchd开行成一般服务模式(与--console意味着的控制台情势相对)

终极但并非最不首要的,类似其他的守护进程(daemon),searchd多种信号。

SIGTERM
展开两回平滑的重启。新的伸手不会被接受;可是曾经上马的乞请不会被强行中断。

SIGHUP
启动索引轮询。取决于 seamless_rotate 的安装,新的伏乞可能会在长期内陷入停顿;客户端将收受到临时错误。

SIGUSR1
强制重新打开searchd日志和询问日志,使得日志轮询可以开展。

3.  search指令参考

search是Sphinx中的一个帮助工具。searchd负责服务器类环境中的搜索,而search留神于在命令行上对索引举行高效测试,而不需要构建一个扑朔迷离的架构来拍卖到劳动器端的连续和处理服务器重回的响应。

注意:search并不是设计用来做为客户端应用程序的一片段。大家强烈提议用户毫无针对search编纂接口,相反,应该针对searchd。Sphinx提供的其他客户端API也都不补助这种用法。(任何时候search总是每一遍都重新调入索引,而searchd会把索引缓冲在内存中以利性能)。

搞清了那些大家就能够延续了。很多经过API构造的询问也可以用search来完成,但是对于非凡复杂的询问,可能依旧用个小本子和对应的API调用来促成相比简单。除此之外,可能有点新的性状先在searchd系统中实现了而尚未引入到search中。

search 的调用语法如下:

search [OPTIONS] word1 [word2 [word3 [...]]]

调用search并不要求searchd正在运作,只需运行search的账户对配置文件和目录文件及其所在路径有读权限即可。

默认行为是对在安排文件中设置的凡事目录的凡事字段搜索word1(AND word2
AND
word3….)。假设用API调用来构建这多少个搜索,那一定于向SetMatchMode传递参数SPH_MATCH_ALL,然后在调用Query的时候指定要询问的目录是*

search有诸多选项。首先是通用的选项:

  • --config <file> (可简写为 -c <file> )
    使search利用指定的部署文件,这与上述indexer的照应选项相同。
  • --index <index> (可简写为 -i <index> )
    使search仅搜索指定的目录。平时它会尝试寻找sphinx.conf中列出的凡事物理索引,不包括分布式索引。
  • --stdin 使search接受正规输入(STDIN)上传播的询问,而不是命令行上交给的询问。有时你要用脚本通过管道给search传入查询,这正是以此选项的用武之地。

设置匹配情势的选项:

  • --any (可简写为 -a) 更改匹配形式,匹配指定的即兴一个词(word1
    OR word2 OR
    word3),这对应API调用中向SetMatchMode传递参数SPH_MATCH_ANY
  • --phrase (可简写为 -p )
    更改匹配情势,将点名的凡事词做为一个词组(不包括标点符号)构成查询,这对应API调用中向SetMatchMode传送参数SPH_MATCH_PHRASE
  • --boolean (可简写为-b ) 将配合情势设为 Boolean
    matching
    。注意如若在命令行上行使布尔语法,可能需要对一些符号(用反斜线“\”)加以转义,以制止外壳程序(shell)或命令行处理器对这多少个标记做特别精通,例如,在Unix/Linux系统上必须转义“&”以防范search被fork成一个后台进程,即使这多少个题目也得以像下文一样通过应用--stdin挑选来化解。那几个选项对应API调用中向SetMatchMode传递参数SPH_MATCH_BOOLEAN
  • --ext (可简写为 -e ) 将十分形式设为Extended
    matching
    。这对应与API调用中向SetMatchMode传递参数SPH_MATCH_EXTENDED。要专注的是因为已经有了更好的扩充匹配情势版本2,所以并不鼓励利用这些选项,见下一条表明。
  • --ext2 (可简写为 -e2 ) 将匹配格局设为 Extended matching,
    version
    2
    。这一个选项对应在API调用中向SetMatchMode传递参数SPH_MATCH_EXTENDED2。要注意这么些选项相相比老的扩展匹配格局更使得也提供更多的风味,由此推荐应用这么些新版的选项。
  • --filter <attr> <v> (可简写为 -f <attr> <v> )
    对结果开展过滤,唯有指定的习性attr匹配指定的值v时才能透过过滤。例如--filter deleted 0 只匹配这一个有deleted属性,并且其值是0的文档。也得以在指令行上多次提交--filter以便指定多重过滤,但是一旦重新定义针对同一个属性的过滤器,那么第二次指定的过滤条件会覆盖第一次的。

用以拍卖搜索结果的选项:

  • --limit <count> (可简写为 -l count )
    限制重返的最多匹配结果数。要是指定了分组(group)选项,则代表的是回去的最多匹配组数。默认值是20个结实(与API相同)
  • --offset <count> (可简写为 -o <count> )
    从第count个结实起初回来,用于给寻找结果分页。如若想要每页20个结实,那么第二页就从偏移量20初阶,第三页从偏移量40开端,以此类推。
  • --group <attr> (可简写为-g <attr> )
    搜索结果按照指定的特性attr举办分组。类似SQL中的GROUP
    BY子句,这会将attr属性值一致的结果结合在一齐,重临的结果集中的每条都是一组中最好的这条结果。尽管没有专门指定,那“最好”指的是相关度最大的。
  • --groupsort <expr> (可简写为 -gs <expr> )
    尽搜索结果遵照-group分组后,再用表明式<expr>的值决定分组的次第。注意,那么些选项指定的不是各组内部哪条结果是最好的,而是分组本身重回的相继。
  • --sortby <clause> (可简写为 -s <clause> )
    指定结果按照<clause>中指定的依次排序。那使用户可以控制搜索结果表现时的顺序,即遵照不同的列排序。例如,--sortby "@weight DESC entrytime DESC" 的情致是将结果首先按权值(相关度)排序,假如有两条或以上结果的相关度相同,则他们的次第由时间值entrytime决定,时间以来(值最大)的排在前面。平常需要将这一个品种坐落引号里(--sortby "@weight DESC")或者用逗号隔开(--sortby @weight,DESC),以防止它们被分开处理。其它,与通常的排序形式相同,倘若指定了--group(分组),这个选项就影响分组内部的结果什么排序。
  • --sortexpr expr (可简写为 -S expr )
    搜索结果呈现的依次由指定的算术表明式expr决定。例如: --sortexpr "@weight + ( user_karma + ln(pageviews) )*0.1"(再度指示,要用引号来制止shell对星号*做特别处理)。扩张排序格局在Sorting
    modes
     一章下的SPH_SORT_EXTENDED条目下实际琢磨。
  • --sort=date 搜索结果按日期升序(日期较久远的在前)排列。要求索引中有一个性能被指定为时间戳。要求索引中有一个性质被指定为时间戳。
  • --rsort=date specifies that the results should be sorted by
    ascending (i.e. oldest first) date. This requires that there is an
    attribute in the index that is set as a timestamp.
  • --sort=ts 搜索结果按时间戳分成组。先回去时间戳在日前一时辰内的这组结果,在组内部按相关度排序。其后归来时间戳为近来一天以内的结果,也按相关度排序。再之后是近些年一周的,最后是多年来一个月的。在Sorting
    modes
     一章的SPH_SORT_TIME_SEGMENTS 条目下对此有更详细的议论。

其余采用:

  • --noinfo (可简写为-q )
    search不在SQL数据库中查询文档信息(Document
    Info)。具体地说,为了调试search和MySQL共同接纳时出现的题材,你可以在应用这多少个选项的同时提供一个依照文档ID搜索整个小说全文的询问。细节可参看sql_query_info指令。

4.  spelldump指令参考

spelldump 是Sphinx的一个帮扶程序。

用于从ispell或者MySpell格式的字典文件中可用来救助建立词形列表(wordforms)的内容——词的方方面面恐怕转变都预先构造好。

相似用法如下:

spelldump [options] <dictionary> <affix> [result] [locale-name]

六个重要参数是词典的主文件([language-prefix].dict)和词缀文件([language-prefix].aff);常常这两种文件被取名为[言语简写].dict和[语言简写].aff,大多数广泛的Linux发行版中都有这么些文件,网上也无处找得到。

[result] 指定的是字典数据的出口地方,而[locale-name]指定了实际使用的区域设置(locale)

再有一个-c [file]采纳,用来指定一个蕴含大小写转换方面细节的文件。

用法示例:

spelldump en.dict en.aff
spelldump ru.dict ru.aff ru.txt ru_RU.CP1251
spelldump ru.dict ru.aff ru.txt .1251

结果文件会蕴藏字典中蕴含的整个词,字典序排列,wordforms文件格式。能够按照实际的运用环境定制这一个文件。结果文件的一个例证:

zone > zone
zoned > zoned
zoning > zoning

5.  indextool命令参考

indextool 是版本0.9.9-rc2中引入的协助工具。用于出口关于物理索引的有余调试音讯。(将来还计划投入索引验证等效果,因而起名较indextool而不是indexdump)。
基本用法如下:

indextool <command> [options]

唯一一个独具命令都有的接纳是--config,用于指定安排文件:

  • --config <file> (可简写为 -c <file> ) 覆盖默认的布置文件名。

此外可用的通令如下:

  • --dumpheader FILENAME.sph 在规划任何其余索引文件甚至配置文件的前提下,神速输出索引头文件的内容,包括索引的上上下下安装,尤其是全部的性质列表、字段列表。在本子0.9.9-rc2事先,这个命令是由search工具提供的。
  • --dumpheader INDEXNAME 输出给定索引名的索引头内容,索引头文件的门路是在配置文件中查得的。
  • --dumpdocids INDEXNAME 输出给定索引名涉及的文档ID。数据是从属性文件(.spa)中抽取的,由此要求doc_info=extern正常工作。
  • --dumphitlist INDEXNAME KEYWORD 输出指定关键字KEYWORD在实践索引中的的所有涌出。

 

  cd c:/
  C:\coreseek-3.2.14-win32\bin\searchd.exe --install --config C:\coreseek-3.2.14-win32\csft.conf --servicename coreseekd 

  注意: 命令一定要是绝对路径,不能使用PATH变量或短路径
     你需要先配置csft.conf文件,笔者测试的MYSQL,详见第二条 

 

  Coreseek/Sphinx有多少个指令调用命令 searchd,search,indexer,spelldump,indextool,以下为摘录于官方文档:

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图