推荐资源
即梦AI

即梦AI

抖音出品 AI视频图片生成

Envato Elements

Envato Elements

无限下载设计素材与模版

Eagle

Eagle

图片素材文献管理神器

Setapp

Setapp

畅享240+款Mac优质应用

高级统计分析

小提琴图生成器

Box Plot 的进阶版。结合了箱线图和核密度图(KDE),能更全面地展示数据的分布形态、概率密度以及多峰特性。

65, 68, 70, 72, 75, 75, 78, 80, 80, 82, 85, 85, 85, 88, 90, 92, 95, 60, 55, 98, 72, 74, 76, 79, 81, 83, 86, 89, 91, 94
50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 52, 58, 62, 68, 72, 78, 82, 88, 92, 98, 45, 48, 55, 65, 75, 85, 95, 60, 70, 80
70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 90, 92, 95, 68, 65, 60, 55, 50, 98, 99
实时预览

考试成绩分布 (小提琴图)

3449648095110一班二班三班班级分数
数据来源: 教务处制图: 颜色代码表

什么是小提琴图 (Violin Plot)?

小提琴图是箱线图 (Box Plot)核密度图 (Kernel Density Plot) 的结合体。 它不仅展示了数据的统计摘要(中位数、四分位数),还通过外围的轮廓(像小提琴的形状)展示了数据的概率密度分布。 这使得我们能够看到数据是否是多峰的(Multimodal),这是单纯的箱线图无法做到的。

小提琴图 vs 箱线图

箱线图的局限

箱线图是一个矩形盒子,它假设数据是单峰的。如果数据有两个峰值(双峰分布),箱线图可能看起来和正态分布一样,从而掩盖了数据的真实结构。

小提琴图的优势

小提琴图的“胖瘦”代表了该数值附近的数据点数量。宽的地方表示数据密集,窄的地方表示数据稀疏。它可以清晰地揭示出数据中的隐藏模式

常见应用场景

  • 基因表达分析

    比较不同样本中基因表达量的分布差异,查看是否存在异常的高表达或低表达群体。

  • 薪资结构调研

    展示不同职位的薪资分布。可以看出薪资是集中在某个区间,还是存在两极分化。

  • 考试成绩分布

    比直方图更紧凑地展示多个班级的成绩分布形态。例如:A班成绩集中,B班成绩两极分化。

  • 用户行为分析

    分析用户在 App 上的停留时长分布,识别核心用户群和流失用户群。

如何阅读小提琴图?

1. 宽度 (Width): 代表频率或密度。越宽的地方,说明在这个数值附近的数据点越多。

2. 长度 (Length): 代表数据的范围(Range),即最大值到最小值。

3. 内部箱体 (Inner Box): 中心通常会画一个微型的箱线图。白点代表中位数,粗黑条代表四分位距 (IQR)。

4. 形状 (Shape):
- 瘦长形:数据分布均匀或离散。
- 扁平形:数据高度集中。
- 葫芦形:双峰分布,说明数据可能来自两个不同的群体。

常见问题 (FAQ)

带宽 (Bandwidth) 是什么意思?
带宽决定了密度曲线的平滑程度。带宽过大会过度平滑,掩盖数据的细节(可能把双峰抹成单峰);带宽过小会产生很多锯齿,显示出过多的随机噪声。在本工具中,您可以调节平滑度滑块来找到最佳的视觉效果。
为什么我的小提琴图看起来被截断了?
标准的核密度估计理论上是无限延伸的。在绘图时,通常会将范围限制在数据极值范围内(trim=True),或者延伸一点点。如果数据集中在边缘(如 0 或 100),图形看起来可能会在两端突然切断。

专注白噪音

雨声Lofi,为设计提供完美背景音。

精选神器

AD
阿里云

阿里云

爆款云服务器特惠抢购

腾讯云

腾讯云

云产品特惠 性价比首选

腾讯元宝

腾讯元宝

免费DeepSeek AI助手

小绿鲸

小绿鲸

英文文献阅读 科研必备

ADVERTISEMENT