编程

MeiliSearch,一个轻量级搜索引擎

2523 2023-04-07 19:48:00

介绍

MeiliSearch 是一个功能强大,快速,开源,易于使用和部署的搜索引擎。搜索和索引都是高度可定制的。允许输入、过滤器和同义词等特性都是开箱即用的。是近两年开源的项目,同样也支持中文分词,在小数据规模下可以实现比 ElasticSearch 更加快速和易用的搜索体验。

支持的功能

  • 开源
  • 用户量(开源搜索引擎第二名)
  • 中文分词
  • 同义词
  • 纠错
  • 高亮
  • 全文返回
  • 高级搜索
  • 停用词、停用字段
  • 加权、降权
  • 逻辑搜索
  • 唯一字段聚合
  • 分页
  • 重新索引

使用

第 1 步:设置和安装

我们将从下载和安装 Meilisearch 开始。您可以选择在本地安装 Meilisearch 或通过云服务部署,以下使用 Docker 部署服务端。

Docker 部署

# Fetch the latest version of Meilisearch image from DockerHub
docker pull getmeili/meilisearch:latest

# Launch Meilisearch
docker run -it --rm \
    -p 7700:7700 \
    -v d:/work/meilisearch/data.ms:/data.ms \
    getmeili/meilisearch:latest

运行 Meilisearch

成功运行 Meilisearch 后,您应该会看到以下响应

第 2 步:添加文档

对于这个快速入门,我们将使用 PHP 作为客户端演示案例

安装 PHP 的SDK

composer require meilisearch/meilisearch-php \
    guzzlehttp/guzzle \
    http-interop/http-factory-guzzle:^1.0

SDK 地址 https://github.com/meilisearch/meilisearch-php/

添加索引文档

require_once __DIR__ . '/vendor/autoload.php';

use MeiliSearch\Client;

$client = new Client('http://192.168.3.12:7700');

# An index is where the documents are stored.
$index = $client->index('movies');

$documents = [
    ['id' => 1,  'title' => 'Carol', 'genres' => ['Romance, Drama']],
    ['id' => 2,  'title' => 'Wonder Woman', 'genres' => ['Action, Adventure']],
    ['id' => 3,  'title' => 'Life of Pi', 'genres' => ['Adventure, Drama']],
    ['id' => 4,  'title' => 'Mad Max: Fury Road', 'genres' => ['Adventure, Science Fiction']],
    ['id' => 5,  'title' => 'Moana', 'genres' => ['Fantasy, Action']],
    ['id' => 6,  'title' => 'Philadelphia', 'genres' => ['Drama']],
];

# If the index 'movies' does not exist, Meilisearch creates it when you first add the documents.
$index->addDocuments($documents); // => { "uid": 0 }

第 三 步:使用文档

基础搜索

$client = new Client('http://192.168.3.12:7700');
 
# An index is where the documents are stored.
$index = $client->index('movies');
// Meilisearch is typo-tolerant:
$hits = $index->search('wondre woman')->getHits();
print_r($hits);

自定义搜索

require_once __DIR__ . '/vendor/autoload.php';

use MeiliSearch\Client;

$client = new Client('http://192.168.3.12:7700');
$index->search(
    'phil',
    [
        'attributesToHighlight' => ['*'],
    ]
)->getRaw(); // Return in Array format

输出结果

{
    "hits": [
        {
            "id": 6,
            "title": "Philadelphia",
            "genre": ["Drama"],
            "_formatted": {
                "id": 6,
                "title": "<em>Phil</em>adelphia",
                "genre": ["Drama"]
            }
        }
    ],
    "offset": 0,
    "limit": 20,
    "processingTimeMs": 0,
    "query": "phil"
}