Elasticsearch简述

Elasticsearch 是一个强大的开源搜索和分析引擎，专为处理海量数据而设计。

概念	类比关系型数据库	说明
索引 (Index)	数据库 (Database) 或表 (Table)	存放具有相似特征文档的集合，如 `products` 索引用于存放所有商品信息。
文档 (Document)	一行数据 (Row)	基本信息单元，以 JSON 格式表示，如一个商品的所有信息。
字段 (Field)	一列 (Column)	文档中的属性，如 `商品名称`、`价格`。
映射 (Mapping)	表结构 (Schema)	定义索引中各个字段的类型（如文本、数字、日期）和属性。
集群 (Cluster)	-	由一个或多个节点组成的集合，共同协作。
节点 (Node)	-	集群中一个独立的服务器实例，承担不同角色（如主节点、数据节点）。
分片 (Shard)	表分区 (Partition)	索引可以被分成多个部分，分布式存储在不同节点上，便于水平扩展。
副本 (Replica)	-	每个分片的拷贝，用于提供高可用性和提升查询性能。

请注意：在 Elasticsearch 7.0 之后，类型 (Type) 的概念已被废弃，现在一个索引中通常只包含一种类型的文档。

Elasticsearch 的核心价值体现在以下几个方面：

分布式与高可用：其分布式架构允许你将一个巨大的索引切割成多个分片，并将其连同副本一起分布到不同的服务器（节点）上。这样不仅突破了单机容量限制，实现了水平扩展，还能在某台服务器故障时，由副本分片立即接管，保证系统高可用。
近实时搜索 (NRT)：数据被存入 Elasticsearch 后，通常在 1 秒内 就可以被搜索到，这种近实时性使其非常适合监控、日志分析等场景。
强大的全文搜索能力：这源于其核心的 倒排索引 机制。简单来说，它像一本书末尾的索引，记录每个关键词出现在哪些文档中。当搜索“手机”时，无需扫描所有商品，可直接找到包含“手机”的文档列表，效率极高。同时，它支持模糊查询、同义词、高亮等高级功能。
丰富的分析与聚合功能：除了搜索，Elasticsearch 还能执行复杂的聚合操作，轻松完成诸如计算不同商品分类的销售额平均值、按小时统计网站访问量等数据分析任务。
RESTful API 与易用性：所有操作，从数据写入到复杂查询，都可以通过简单的 RESTful API 以 JSON 格式进行，极大降低了开发难度。

Elasticsearch 的能力使其在多种场景下大放异彩：

应用与网站搜索：为电商网站、应用商店、内容管理系统提供高效、智能的搜索功能，支持拼写检查、搜索建议等。
日志管理与分析 (ELK Stack)：结合 Logstash（数据采集）、Elasticsearch（存储与搜索）、Kibana（可视化）构成的 ELK Stack，是业界成熟的日志管理方案，用于运维监控、安全审计等。
指标和应用程序性能监控 (APM)：收集并分析服务器、容器、应用程序的性能指标，实现实时监控和告警。
业务智能与分析：对业务数据进行实时聚合分析，例如分析销售趋势、用户行为，并借助 Kibana 制作可视化大屏。

米奇不妙屋