导入数据
本文中我们介绍索引的概念和如何向索引中导入数据
按整理数据一文中的教程,将数据整理为 JSON 格式后,即可开始向索引中导入数据。
导入的数据在哪里
卡拉搜索维护一系列搜索服务器。
我们维护搜索服务有以下几个理由
- 卡拉搜索的服务器允许我们随时更新我们的搜索引擎,以便用新功能和更快的引擎服务我们的用户
- 我们维护的服务器可以免去用户运维的成本和压力,用户只需专心做好业务
- 线上的服务器可以允许用户随时更新配置,达到实时配置实时生效
目前卡拉搜索的所有物理服务器运行在阿里云中。
向你的索引中添加数据
你向卡拉搜索导入的数据会存储在专属于你的索引中,没有你的允许,没有第三方可以向你的索引中写入或更改数据。
要向卡拉搜索添加数据,有两种途径
- 用卡拉搜索提供的 SDK 来导入数据 - 推荐
- 登录卡拉搜索管理后台上传数据 - 供实验使用
查看索引信息
在卡拉搜索后台你可以查看你的索引列表。如果还没有创建过索引,你可以点右上方 创建索引
按钮来创建。
在下方显示了你的索引列表。列表中,你可以找到你的索引对应的名字和 ID。这里的 索引ID 非常重要,在请求 API 时会用到。
每一个索引有一个专属的索引 ID,这个 ID 是唯一的。索引信息只能在后台或用你的 ApiKey 才能更改,以此保证你的数据安全。
初始导入数据
假设你第一次接入卡拉搜索,这时你的索引中没有数据,你需要先从你的数据源中将数据导入索引中。
我们用一个实例来说明
假设你的搜索数据是豆瓣的电影数据,在你的数据源中一条数据如下表
movie_name | actors | year |
---|---|---|
大话西游 | 周星驰/吴孟达 | 1998 |
那么我们推荐你用 Python 或者任何你熟悉的语言,将数据整理为 JSON 格式,如下
{"name": "大话西游","actors": "周星驰/吴孟达","year": 1998}
当然,你的数据肯定不止一条。在处理多行数据时,用一个循环即可将数据源中所有数据插入索引中。
在插入索引时,你需要有索引的可写权限。你可以选择用有管理员权限的 ApiKey 或新创建一个带有 增改权限
的 ApiKey 来向索引中写入。
针对具体语言的例子请参考对应语言的接入教程