5个分析工具来改善你的机械工程简历、职业和知识

挑战的一部分(和乐趣!作为一名机械工程师,不断寻求改进的机会。无论是你的产品还是过程,机械工程师都有责任找出问题并进行实验来改进它们。是时候花点时间让自己成为更...
挑战的一部分(和乐趣!作为一名机械工程师,不断寻求改进的机会。无论是你的产品还是过程,机械工程师都有责任找出问题并进行实验来改进它们。是时候花点时间让自己成为更好的工程师了吗?学习和利用这些分析工具不仅能帮助你做得更好,还能为你提供更多的工具来应对新的和令人兴奋的挑战。

1. 使用可视化识别产品中的问题。在可能的情况下,收集常用的数据并绘制成图表直方图、帕累托图、热图甚至相关图. Minitab的新图形生成器使您能够轻松地可视化您的数据,并看到您从未考虑过的可视化效果。

2. 使用过程分析工具识别问题。无论您是否已经识别出问题,过程分析工具都可以帮助您回顾过程,以识别失败的地方或改进的机会。故障模式和影响分析,也称为FMEAs,帮助您评估风险和流程图或流程图可以帮助你快速锁定需要关注的区域。

3. 使用控制图评估过程稳定性。机械工程师应该监控他们的过程,以确保质量和一致性。有许多统计工具,如控制图和能力分析这有助于机械工程师监控过程中的变化,并确定过程是否会生产出符合要求规格的产品。Minitab支持的实时SPC提供即时警报和分析,以确保流程稳定、高效和有能力。

4. 使用产品开发工具和方法设计和开发原型。在使用CAD系统之前,你应该使用许多产品开发工具。将产品推向市场需要对客户的需求和需求有充分的了解,以及严格的方法。学习如何使用决策矩阵工具就像质量矩阵或Pugh矩阵或向这家医疗设备制造商学习,他们利用客户总结和Kano模型的声音,以迅雷不及掩耳之势将新产品推向市场。如果您有兴趣了解产品开发方法(以及更多!),请查看我们的结构化问题解决方法周期表.

5. 利用实验设计。实验设计(DOE)是一种系统的、严谨的解决问题的方法,它确保产生有效的、可辩护的和可支持的结论。它可以有效地解决一般问题,以及改善或优化产品设计和制造过程。机械工程师可以使用DOE来:确定适当的设计尺寸和公差,实现稳健设计,描述物理系统行为或确定理想的制造设置。 收起阅读 »

用DOE烤出更好的饼干

当他们最喜欢的糖曲奇配方制作的曲奇在烘焙后无法保持节日形状时,一个有质量意识的面包师该怎么办呢?当然是运行实验设计(DOE)啦! [b]从部分因子实验开始[/...
当他们最喜欢的糖曲奇配方制作的曲奇在烘焙后无法保持节日形状时,一个有质量意识的面包师该怎么办呢?当然是运行实验设计(DOE)啦!

从部分因子实验开始

莫德·沃德是Minitab的一名狂热的面包师和平面设计师,他使用实验设计(DOE)工具Minitab统计软件去弄清她糖饼干造型的失礼之处。

在Minitab出色的技术支持团队的帮助下,Maud设计了一个实验,让她能够筛选许多因素,确定哪些是最重要的,然后调整她的过程,以获得她想要的结果——在这种情况下,制作烘烤后保持形状的饼干。

她决定经营一家部分因子实验,一类因子设计,可让您快速、经济地确定过程中最重要的因素。

莫德的实验要求她进行八次运行(或批次饼干)来评估六个因素,每个因素都在两个水平上进行测试:

· 烤箱温度:325华氏度或375华氏度

· 鸡蛋数量:1或2

· 通用面粉:9盎司。或者13.5盎司。

· 小苏打:0.5或1茶匙

· 酒石霜:0.5或1茶匙

· 揉搓和切割后冷却面团:是或否

为了确保面团厚度一致,莫德用木条来防止她的擀面杖将面团压得比1/4英寸(6.35毫米)更薄。然后,她随机地将饼干放置在烤板上,以尽量减少烘烤过程中的不当影响或无意偏差,并在烘烤中途将烤板旋转180度。

因为实验中使用了两种烤箱温度,所以烘烤时间因试验而异。每次试验的实际烹饪时间记录在试验说明表上。

每次试验包括烘烤两托盘饼干。当它们从烤箱中出来时,莫德测量了两个托盘中每种形状的两个样品,以查看整体高度、选定的宽度尺寸或厚度是否有变化。这些尺寸记录在预先打印的表格上,表格上标明了试验编号、试验数据、宽度和高度。莫德计算了她的饼干形状的平均值和标准偏差,然后使用Minitab统计软件来分析数据。

获得美味的DOE结果

在Minitab中进行的高度和宽度测量的分析显示,面粉是饼干扩散的驱动因素。莫德说:“在每一个例子中,面粉量越多,从原始尺寸开始的扩散就越少。”“对饼干厚度的影响主要受面粉和面糊中鸡蛋数量的影响。用两个鸡蛋比只用一个鸡蛋产生的上升更多。”

莫德随后使用Minitab创建了主要效果图,检查一个或多个因素的水平平均值之间的差异。

DOE1.png


DOE2.png


​最后,响应优化器帮助确定导致最小扩散和最大高度的因子设置。

DOE3.jpg


由于Minitab和技术支持团队的帮助,Maud现在相信她设计和分析的实验将在这个假期和未来的更多假期中带来更好的饼干。对我来说,听起来像完美的,美味的结果! 收起阅读 »

DOE之优化烧烤口味01-创建建模设计

概述 试验设计(DOE)具有难度,但在某种程度上,这种统计方法又非常有用。虽然很容易掌握基本思想:从最少的实验运行中获取最大量的信息 。但这个工...
概述

试验设计(DOE)具有难度,但在某种程度上,这种统计方法又非常有用。虽然很容易掌握基本思想:从最少的实验运行中获取最大量的信息 。但这个工具的实际应用会很令人头疼,即使你是试验设计的长期使用者。基于DOE是一个非常强大且有用的工具,因此我们在Minitab协助菜单中添加了一个DOE工具,使更多人能够更方便地使用设计试验。我将向您展示如何使用协助菜单中的DOE工具来优化您的烧烤味道。

两种试验设计:筛选和优化

要使用“协助”创建试验设计,请打开Minitab并选择“ 协助”>“DOE”>“计划和创建”。您将看到一个决策树,通过在筛选设计和建模设计之间进行选择,帮助您采用顺序方法进行试验过程。

如果您需要考虑很多潜在因子 并且想要确定哪些是重要的,筛选设计很重要。协助将指导您完成测试和分析6到15个因子的主要影响的过程,并确定对响应影响最大的因子。一旦确定了关键因子,就可以使用建模设计。选择此选项,协助将指导您完成分析2到5个关键因子,并帮助您找到流程的最佳设置。

即使您是分析设计实验的老手,您也可以使用协助创建设计,因为协助可以让您为每个实验运行打印出易于使用的数据收集表单。收集并输入数据后,还可以使用通过统计> DOE菜单提供Minitab 核心DOE工具分析在协助菜单中创建的设计 。

创建建模设计优化烧烤口味

对于烧烤,没有那么多变量需要考虑,因此我们将使用协助来创建一个可以优化我们烧烤过程的建模设计。选择协助> DOE> 计划优化试验,然后单击“创建建模设计”按钮。

Minitab提供了一个易于理解的对话框; 我们需要做的只是填写。

首先,我们输入响应的名称和实验的目标。这里的响应变量是“口味”,目标是“最大化响应”。接下来,我们输入我们的因子。我们将研究三个关键变量:

串数,连续变量,低水平为1,高水平为3。

烤架类型,类别变量,低水平为气体,高水平为木炭。

调味料的类型,类别变量,低水平是盐胡椒,高水平为蒙特利尔牛排。

如果我们想要,我们可以选择超过1个实验仿行。仿行只是一组完整的实验运行,因此如果我们进行3次仿行,我们将重复完整实验三次。但是,由于这个实验有16次运行,我们的预算有限制,我们将坚持一次仿行。 当我们单击“确定”时,“协助”会首先询问是否要打印出此实验的数据收集表单:

选择是,您可以打印一个表单,列出每个运行,变量和设置,以及空的响应列。或者,您可以在协助创建的工作表中记录每次运行的结果。但是,使用打印的数据收集表单可以更容易地跟踪您在试验中的位置,以及每次运行时您的因子设置应该是什么。

如果您已将Minitab中的协助用于其他方法(例如:控制图、过程能力分析),您就会知道它旨在揭开您的分析的神秘面纱并使其易于理解。在您创建实验时,智能协助菜单会为您提供报告卡和摘要报告,说明DOE的步骤和重要注意事项,以及您的目标摘要和分析将显示的内容。 收起阅读 »

如何在通货膨胀时期降低供应链成本

现在,检查和降低供应链成本比以往任何时候都更加重要。虽然降低供应链成本是公司多年来一直在努力的持续改进工作,但现在降低成本的需求更加紧迫。 影响这些费用的因素...
现在,检查和降低供应链成本比以往任何时候都更加重要。虽然降低供应链成本是公司多年来一直在努力的持续改进工作,但现在降低成本的需求更加紧迫。

影响这些费用的因素有很多。Minitab 提供的工具可帮助您调查并降低成本,同时让您的客户满意。

Minitab 的供应链模块以常用和易于理解的术语提供指导性数据分析。将您的重点转移到改进关键绩效指标 (KPI),例如周期时间、库存、交付、质量、盈利能力和成本,而不必担心使用哪种分析。

单位运费

许多公司会跟踪每单位的运费,即总运费除以运送的单位数量,影响这一成本的因素很多,一些公司通过与运输公司和客户合作来实现双赢。考虑以下问题:

· 可以合并小件货物吗?或者至少通过寻找合作伙伴来保持稳定的发货量,并对货物进行分组?

· 能否进一步减轻垫料重量?承运人可能有一些宝贵的意见。

· 托盘包装是否高效?是否有改进余地?

· 尝试在非工作时间取货,节省高达 30% 的费用。

Minitab 的供应链模块提供调查单位运费的工具。考虑用相关图调查连续因素,如运费、装货时间、装货重量和垫料重量。

图片1.png


您还可以创建热图来调查分类因素,例如产品、运输承运人、预定取货时间以及您是否有运输合同或运输奖励措施。

图片2.png


运单准确性

此外,您应该定期检查货运单的准确性。公司会报告经常出现的各种错误:如重量计价运费错误、货运等级代码错误、重复发票以及忽视的折扣。这些都要检查。

Minitab 的供应链模块提供了许多工具来调查货运单的准确性。通过 Pareto 图可以分析货运单错误。通过 CART 分类树可以进行更复杂的分析。除了上面两种工具外,Minitab 还提供许多其他有助于调查、沟通和减少货运单错误的工具。 收起阅读 »

广受欢迎的Weibull 分布永远是最佳选择吗?

本文最初出现在The Minitab Blog 在大学里,我有一个朋友,他无论到哪儿都能融入其中。他中午还在跟一群教授共进午餐,下午就在公园里和嬉皮士踢沙包,...
本文最初出现在The Minitab Blog

在大学里,我有一个朋友,他无论到哪儿都能融入其中。他中午还在跟一群教授共进午餐,下午就在公园里和嬉皮士踢沙包,晚上又会和当地的摩托车骑手在城里秩序最差的酒吧厮混在一起。第二天,他又和体育爱好者一起打橄榄球,然后和游戏伙伴一起去参加通宵的局域网游戏聚会。在平常的周末,他可能会和校园里一小群积极正派的朋克摇滚乐手参加一场面向各个年龄段的演出,或者和一些城里人饮酒作乐,然后和物理社的朋友一起玩一些 D&D 游戏来结束这个周末。

他就像一只变色龙,跟什么人交往就能投其所好,打成一片。这种灵活性让他在各种各样的社交圈中如鱼得水。

他叫 Jeff Weibull,他非常受欢迎,以至于当地统计人员甚至以他的名字命名“Weibull 分布”。

是什么使得 WEIBULL 分布如此受人欢迎?

好吧,我只是编造了最后一部分,Jeff 的姓实际上并不是“Weibull”,此分布完全是以其他人的名字命名的。 但是,当我第一次了解 Weibull 分布时,我立刻想起了 Jeff,以及他似乎不费吹灰之力就能在形形色色的社交场合中游刃有余的场景。

正如 Jeff 是不同社交圈子中的变色龙一样,Weibull 分布能够呈现许多不同类型分布的特征。这使得它在工程师和质量从业者中极受青睐,他们使该分布成为可靠性数据建模中最常用的分布。他们喜欢将 Weibull 分布纳入其数据分析中,因为它足够灵活,可以对各种数据集进行建模。

获得了右偏斜数据?Weibull 可以对其进行建模。左偏斜数据?当然,使用 Weibull 绝对没问题。对称数据?Weibull 能够胜任。正是因为 Weibull 分布的这种灵活性,工程师才用它来评估所有物品(从真空管、电容器到滚珠轴承和继电器等)的可靠性和材料强度。

Weibull 分布还可以对递减、递增或固定风险函数进行建模,使其能够描述物品寿命的任何阶段。

WEIBULL 曲线如何改变其形状

那么,Weibull 分布到底有多灵活呢?让我们来看一些使用 Minitab Statistical Software 中的图形 > 概率分布图的示例。

图片1.png


在“分布”下拉菜单中依次选择“单一视图”和“Weibull”。该对话框将用于指定三个参数:形状、尺度和阈值。

阈值参数指示分布从 0 偏移的情况,负阈值会将分布从 0 向左偏移,正阈值会将分布向右偏移。所有数据都必须大于阈值。尺度参数是数据的 63.2 百分位数,它定义了 Weibull 曲线与阈值的关系,就像均值定义正态曲线的位置一样。在我们的示例中,我们使用的尺度为 10,即 63.2% 的测试产品将在阈值时间后的前 10 个小时内发生故障。形状参数描述 Weibull 曲线的形状。通过更改形状,可以对许多不同寿命分布的特征进行建模。

在本帖中,我将专门讨论形状参数如何影响 Weibull 曲线。我将逐一介绍这些参数,但是,如果您希望它们同时出现在一张图中,请在上面显示的对话框中选择“不同参数”选项。

形状值小于 1 的 WEIBULL 分布

让我们从 0 到 1 之间的形状开始。下图显示概率从无穷大呈指数递减的情况。就失效率而言,符合此分布的数据的初始失效率极高,随着时间的推移,由于缺陷产品从样本中消除,因此失效率会下降。这些早期失效通常被称为“早期损坏率”,因为它们发生在产品寿命的早期阶段。

图片2.png


形状值等于 1 的 WEIBULL 分布

当形状值等于 1 时,Weibull 分布从 1/alpha 呈指数递减,其中 alpha = 尺度参数。在本质上,这表示失效率随着时间的推移保持一致。Weibull 分布的这种形状适用于随机失效和多原因失效,并可用于对产品的使用寿命进行建模。

图片3.png


形状值介于 1 和 2 之间的 WEIBULL 分布

当形状值介于 1 和 2 之间时,Weibull 分布迅速攀升到峰值,然后随着时间的推移下降。失效率总体上是增加的,最初增加得最快。此形状表示早期磨损失效。

图片4.png


形状值等于 2 的 WEIBULL 分布

当形状值达到 2 时,Weibull 分布对线性增加的失效率进行建模,在产品的使用寿命内,磨损失效风险随着时间的推移不断增加。这种形式的 Weibull 分布也称为 Rayleigh 分布。

图片5.png


形状值介于 3 和 4 之间的 WEIBULL 分布

如果我们将形状值放在 3 和 4 之间,Weibull 分布就会变为对称的钟形,就像正态曲线一样。这种形式的 Weibull 分布对产品寿命的最后阶段(大多数失效发生在这一阶段)中的快速磨损失效进行建模。

形状值大于 10 的 WEIBULL 分布

当形状值大于 10 时,Weibull 分布类似于极值分布。同样,这种形式的分布可以对产品寿命的最后阶段进行建模。

图片7.png


WEIBULL 永远是最佳选择吗?

涉及可靠性时,Weibull 分布通常是万能分布,但一定要注意的是,其他分布系列也可以对各种分布形状进行建模。您希望找到最适合您的数据的分布,而这可能不是 Weibull 分布形式。例如,由化学反应或腐蚀引起的产品失效通常采用对数正态分布进行建模。

您可以使用 Minitab 的分布 ID 图来评估数据的拟合情况(统计 > 可靠性/生存 > 分布分析(右删失或任意删失))。如果您想了解更多详细信息,请查看 Jim Frost 撰写的有关确定数据分布的帖子。 收起阅读 »

如何在残差四合一图中显示P值?

在进行回归分析、实验设计分析过程中,我们在得到回归模型后需要进行“残差分析”。下面我以蓝皮书(第三版)P313的多元线性回归的例9-3为例。 某手机厂研究如何...
在进行回归分析、实验设计分析过程中,我们在得到回归模型后需要进行“残差分析”。下面我以蓝皮书(第三版)P313的多元线性回归的例9-3为例。

某手机厂研究如何提高线路板焊接制程的拉拔力问题。根据过去的经验知道,拉拔力可能与烘培温度、烘烤时间和涂抹的焊膏量有关,现从制程中收集了20批数据,试建立拉拔力与个因素的回归模型。

1.png


一、软件操作

2.png


3.png


二、残差四合一图

在本篇文章中,我们感兴趣的四合一图中的正态概率图,所以对于其他结果不做过多解释。

4.png


“正态概率图”可以帮助我们判断残差是否服从正态,但是有朋友会发现在正态概率图中有时候会显示P值,有时候无法显示。

如果想把P值显示在概率图中我们需要做一些设置。

选择:文件-选项

5.png


6.png


勾选“包括带有正态图的Anderson-Darling检验(A)”

勾选以后,我们就可以在残差的正态概率图中显示P值了。

7.png

  收起阅读 »

提高流程效率:5 个关键的精益工具

精益,也称为“精益制造”或“精益生产”,专注于通过消除浪费和消除缺陷来最大化客户价值。精益工具是关于理解过程、寻找浪费、防止错误和记录你所做的事情。 让我们看...
精益,也称为“精益制造”或“精益生产”,专注于通过消除浪费和消除缺陷来最大化客户价值。精益工具是关于理解过程、寻找浪费、防止错误和记录你所做的事情。

让我们看一下流程改进中使用的五种精益工具,它们的作用以及它们为何重要。Minitab Engage可以帮助您开始利用精益工具和其他持续改进方法在您的业务中蓬勃发展。如果您可以与您的团队共享和协作,这些工具会更加强大,因此我们鼓励您也尝试 Engage 的在线仪表板报告功能。

1. 客户之声(VOC)摘要

收集客户的声音是实施精益的关键步骤。VOC 摘要提供了一种捕获重要数据的方法,因此您可以对其采取行动来实现关键业务目标并改善客户关系。

精益的基本原则是了解客户需求并设计流程以完全满足(或希望超过)客户期望。使用 VOC 摘要工具将帮助您了解关键的客户问题并将这些问题转化为关键的客户需求。

2. 工艺流程

流程流,也称为流程图,可帮助您理解和交流流程中的活动或步骤。它们还可以帮助您查看流程中输入和输出之间的关系,确定关键决策点并发现返工循环。

因为这种易于可视化的方法可以让人们清楚地看到一个过程,所以与参与过程的团队一起构建过程图是最有效的。工艺流程的创建使浪费变得可见(瓶颈、延迟、存储、返工等),并显示了改进的最佳机会。

3. 价值流图(VSM)

价值流是所有活动的集合,包括增值和非增值,它们产生满足客户需求所需的产品或服务。价值流图通过添加更多数据(超出 x 和 y)、材料和信息流来扩展流程的有用性;操作参数;缺陷率、交货时间等。当前状态价值流图可识别浪费并帮助您的团队设想改进的未来状态。

4. 五个为什么

精益是关于理解为什么事情会以它们的方式完成。通常,事情在错误的时间不正确地完成,或者完全跳过,从而导致流程问题。使用五个为什么工具来确定问题的根本原因。重复问题“为什么?” 您可以发现问题的根本原因、不同根本原因之间的关系,并确定防止问题再次发生的步骤。

真正的根本原因应始终指向无法正常运行或不存在的流程。大多数时候,人们不会失败;过程做。

5. 5S审核:分类、有序、闪耀、标准化和维持

5S 是一套基于团队的工具,可以系统地、有条不紊地组织工作场所。一个干净、井井有条的工作场所可以提高效率并消除浪费。

第五步,维持,是最难完成的步骤之一。这类似于减肥并保持体重。维持需要定期保持过程改进的收益。

没有它,旧习惯重新出现,工作场所陷入混乱。Engage的在线仪表板报告的优势之一是可以看到每个人的进度。每个人都可以看到好处,并被鼓励继续保持下去。 收起阅读 »

用 Minitab 夺金:Newcrest Mining Limited

Newcrest Mining Limited 是世界十大黄金开采公司之一,也是澳大利亚最大的黄金生产商。Newcrest 的 Cadia Hill 矿是澳大...

Newcrest Mining Limited 是世界十大黄金开采公司之一,也是澳大利亚最大的黄金生产商。Newcrest 的 Cadia Hill 矿是澳大利亚第二大露天金铜矿,每年生产约 300,000 盎司黄金。但其低品位矿石需要昂贵的大宗开采和处理技术。Newcrest 应用 6 Sigma 质量改进方法和 Minitab® 统计软件来保持 Cadia Hill 设施尽可能高效地运行,并维护其在黄金行业中的突出地位。

挑战

每天有很多次,一队大型运输卡车从狭窄的坡道下到卡迪亚山露天矿坑的底部,每辆卡车平均装载 225 吨矿石,然后从坡道上运回破碎机进行加工。装载的卡车登上单车道坡道的速度从每小时 8 公里到 14 公里不等。当然,速度较慢的卡车需要更长的时间才能将有效载荷运送到破碎机。更糟糕的是,每辆慢速卡车都会延误其后面的所有卡车,从而影响整个车队的性能并导致生产力严重下降。Newcrest Mining 委托六西格码黑带 James Kovac 减少这种可变性并提高上升卡车的平均速度。

mine.jpeg


借助 Minitab Statistical Software,Newcrest Mining 每天可以从其 Cadia Hill 矿场为每辆卡车额外装载矿石。

Minitab 如何提供帮助

Kovac 和他的项目团队首先确定了可能影响卡车速度的变量。他们收集数据以确定哪些因素的影响最大,使用 Minitab 计划他们的数据收集过程,确定他们需要的样本量,并检验他们的统计假设。然后,他们选择了五辆卡车进行车载数据收集。团队成员在两周内乘坐卡车,使用笔记本电脑、GPS 装置和其他设备收集大量数据。

他们确定有两个因素对卡车速度有重大影响:坡道的坡度和卡车的喷油器。

该团队现在开始测试解决方案并确认其结果。他们改变了运输坡道小部分的坡度,然后测量了改变部分的卡车速度。将前后速度与 Minitab 的 2 样本 t 检验进行比较后发现,坡度调整显着提高了卡车速度。

dumptruck.jpeg


chartgraphic.jpeg


Minitab 强大的图形可以快速而清晰地显示卡车的一个燃油喷射器何时不工作。

该团队还设计了一种明确的方法来识别有故障的燃油喷射器。他们以 700 RPM 的速度运行每辆卡车,并测量了所有 16 个气缸之间的喷油器正时。然后他们依次关闭每个气缸,让其他 15 个保持 700 RPM。如果其余气缸在关闭时没有受到显着影响,则该气缸性能不佳,需要一个新的喷油器。该测试现已纳入车队维护程序,使用 Minitab 宏生成的控制图快速显示结果。

结果

Minitab 的统计能力和易于理解的图形帮助 Kovac 和他的团队在提高 Newcrest 的 Cadia Hill 矿的生产力方面取得了重大进展。

使用 Minitab 计划他们的实验并在每个步骤分析他们的数据,他们证明了在测试部分将运输坡道的坡度从 10.22% 降低到 9.9% 会导致卡车速度提高 2.6%,并且卡车速度的变化减少了7%。现在整个运输坡道正在检查和改进,任何坡度超过 10% 的路段都将降低到 10% 或更低。预计此调整将在每次完整的上坡行程中至少节省 8.3 秒。

Minitab 对团队燃油喷射器数据的分析还显示,车队中有 10% 的卡车并未在高峰期运行。作为开发用于识别和更换故障喷油器的新程序的一部分,该团队发现,更换一辆卡车上的一个喷油器可将循环时间缩短 5.6%,足以让每辆卡车每天多出一次坑。

这些改进使 Cadia Hill 矿山的生产效率更高、效率更高。得益于 Kovac 和他的团队、六西格码方法和 Minitab 的强大功能,Newcrest Mining 预计仅在实施这些更改的第一年就可以节省超过 835,000 美元。 收起阅读 »

精益工具丨创建有效价值流图时需要遵循的五点指南

价值流图析是精益过程改进方法的基石,也是六西格玛中使用的获得认可的工具。价值流图说明当产品或服务遍历整个过程时的材料和信息流。创建“当前状态”价值流图可以帮助您...
价值流图析是精益过程改进方法的基石,也是六西格玛中使用的获得认可的工具。价值流图说明当产品或服务遍历整个过程时的材料和信息流。创建“当前状态”价值流图可以帮助您识别浪费现象并更容易设想未来改进状态。
可以使用价值流图析来改进任何过程。但是,除非正确使用该工具,否则并非所有可提高质量和效率的机会都能由价值流图捕获到。

下面是从投入到价值流图析的精力中获得最大好处的五点指南:

1.根据客户要求建立价值流图过程。

您必须了解客户的价值观,并以此作为切入点。如果您不这样做,用我最喜欢的乐队 The Fall 的话来说,您会冒着“高度关注错误细节”的风险。
 
2.捕获过程现在的运行情况,而不是它应该如何运行。

如果某个过程在企业只有 20 名员工时运行良好,但现在企业有 200 名员工,该过程的执行效率可能没有以前高。请确保按照现在的情况(而不是过去的工作方式或您希望的工作方式)绘制过程图!
 

3.指派一名价值流图管理人员来领导图析工作。

来自团队成员和利益相关者的输入很重要,但一定要任命(或选举)一名团队成员来绘制整个价值流图。这可确保管理人员了解材料和信息流。

4.遍历整个过程以确保材料和信息流准确无误。

通过从头到尾跟踪过程来验证价值流图是否反映过程的真实情况,这样可揭示您可能错过的关键细节。

5.一次只关注一小步。
 
请确保准确地捕获每个步骤。例如,要测量周期时间,请勿相信挂钟,而要使用秒表。

创建当前过程状态的价值流图有助于将重点放在浪费领域(如库存过剩、非增值时间和多个操作员)。在构想过程的未来状态时,可以改变当前状态图上的数据,以探索改进可能带来的效果。

尽管可以在纸上绘制价值流图析,但软件工具(如 Minitab Worksapce 中的软件工具)会使价值流图的绘制轻松很多。  收起阅读 »

优秀试验设计的8个专业建议

如果您的工作涉及质量改进,那么您至少听说过实验设计 (DOE)。您可能知道这是优化和改进流程的最有效方式。但我们中的许多人发现 DOE 令人生畏,尤其是如果它不...
如果您的工作涉及质量改进,那么您至少听说过实验设计 (DOE)。您可能知道这是优化和改进流程的最有效方式。但我们中的许多人发现 DOE 令人生畏,尤其是如果它不是我们经常使用的工具。您如何选择合适的设计,并确保您拥有正确数量的因素和水平?收集数据后,如何为分析选择合适的模型?

开始使用 DOE 的一种方法是 Minitab Statistical Software 中的助手。当您有许多要评估的因素时,助手将引导您完成DOE以确定哪些因素最重要(筛选设计)。然后,助手可以指导您完成设计实验,以微调重要因素以获得最大影响(优化设计)。

如果您可以轻松跳过助手,但对于您是否以正确的方式接近 DOE 仍有一些疑问,请考虑 Minitab 技术培训师提供的以下提示。这些资深人士在与 Minitab 客户合作期间以及在成为 Minitab 培训师之前的职业生涯中,都进行了大量设计实验。

1. 通过探索性运行确定正确的变量空间。
在进行主要实验之前执行探索性运行可以帮助您在性能从好到差时识别过程的设置。这可以帮助您确定进行实验的可变空间,从而产生最有益的结果。

2. 传播控制贯穿整个实验以测量过程稳定性。
由于中心点运行通常是接近正常的操作条件,它们可以作为检查过程性能的控制。通过在设计中均匀地间隔中心点,这些观察结果可作为实验期间过程稳定性或缺乏稳定性的指标。

3. 找出帕累托分析的最大问题。
产品负载或缺陷级别的帕累托图可以帮助您确定要解决的问题,从而为您的业务带来最高回报。关注具有高业务影响的问题,通过在所有潜在改进项目中提高其优先级来提高对实验的支持。

图片1.png


4.通过扩大输入设置范围来提高功率。
测试物理上可能的最大范围的输入变量设置。即使您认为它们远离“最佳位置”,该技术也将允许您使用实验来了解您的过程,以便您找到最佳设置。

图片2.png


5. 分馏以节省运行,专注于分辨率 V 设计。
在许多情况下,选择具有全因子 ½ 或 ¼ 游程的设计是有益的。即使效应可能相互混淆或混淆,Resolution V 设计可最大限度地减少这种混淆的影响,从而使您能够估计所有主要效应和双向交互作用。进行更少的运行可以节省资金并保持较低的实验成本。

图片3.png


6. 通过重复提高实验的效力。
功效是检测到对响应的影响(如果存在该影响)的概率。重复次数会影响实验的功效。为了增加您成功识别影响您的响应的输入的机会,请在您的实验中添加重复以增加其功效。

图片4.png


7. 通过使用量化措施来提高你的反应能力。
减少缺陷是大多数实验的主要目标,因此缺陷计数通常用作响应是有道理的。但是缺陷计数是一种非常昂贵且反应迟钝的输出来衡量。相反,请尝试测量与您的缺陷级别相关的定量指标。这样做可以显着减少样本量并提高实验的能力。

8. 研究所有感兴趣的变量和所有关键响应。
因子设计让您可以采用全面的方法来研究所有潜在的输入变量。从实验中删除一个因素会将您确定其重要性的机会减少到零。借助Minitab 等统计软件中的可用工具,您不应该让对复杂性的恐惧导致您忽略可能重要的输入变量。 收起阅读 »

额外花费 120 小时推动改进时,您会怎么做?

Hermann Miskelly 是一家价值 15 亿美元的工业公司的质量副总裁,他负责领导该公司的持续改进工作。现在,他已有 10 年的精益六西格码部署经验,...
Hermann Miskelly 是一家价值 15 亿美元的工业公司的质量副总裁,他负责领导该公司的持续改进工作。现在,他已有 10 年的精益六西格码部署经验,他监督过 4,000 多个大型改进项目和另外 6,000 个小型改进项目的执行。下面是他分享的关于借助 Minitab Engage 管理持续改进项目的三个关键见解。

1.优化管理系统
您不只需要执行改进项目。还需要改进项目的管理方式。
Miskelly 说:“在我们所有的运营和业务部门中,为了应对高管每月对持续改进工作的审查,每月需要 120 多个工时来整理、分析和准备这些 [Excel] 电子表格”。“总的来说,我们的管理系统缓慢、繁琐且需要大量人工,我们正在寻找更好的方法来执行和管理我们的持续改进工作。”
为了与领导核心保持战略一致,一定要拥有一种管理工具来促进日常项目管理并允许您快速报告进度。如果在从不同内部系统中的不同报告中收集数据方面浪费时间,就会使您错过对重要变革的推动。

2.平坦化学习曲线
无论是实施新过程还是给新员工进行入职培训,学习新工具或软件所需的时间都会减少。
“有了新的 Minitab Engage 软件系统,所有这些实施或培训工作基本上都会消失。使用 Engage 的桌面项目管理部分执行各个项目。与之前的 Minitab Quality Engage 类似,我们的绿带和黑带的学习曲线最短。用于初始项目审批和最终项目审查的自定义表单已集成到标准模板中,进一步简化了项目管理。”

3.便于跟踪结果
Miskelly 表示,Engage 的控制台功能极大提升了公司管理海量项目的能力。
“我们的运营和业务部门负责人不再在月底整理和分析电子表格,而是能够从整体上查看部门的持续改进工作,如果需要,可以深入到各个项目。控制台允许他们实时跟踪项目信息(计数、已开始、已完成、延迟等)和财务信息(如预测节省量与实际节省量)。运营和业务负责人现在可以专注于分析进度和确定新项目机会...Minitab 再次调研并听取了客户的意见,交付了一款解决我们持续改进问题的产品。” 收起阅读 »

制造业面临的一个主要问题:稳定性!

任何不稳定的行为和过程都会给客户带来质量问题和干扰。为了防止出现问题,部件必须采用稳定的过程制造,而且制造过程必须符合预期规范并高于客户满意度。 然而,制造过...
任何不稳定的行为和过程都会给客户带来质量问题和干扰。为了防止出现问题,部件必须采用稳定的过程制造,而且制造过程必须符合预期规范并高于客户满意度。

然而,制造过程中通常有多个连续的步骤。即使一个步骤出现轻微偏差也可能影响整条生产线。为了帮助您更好地理解制造稳定性,本篇文章将:

1. 探索对改进生产稳定性起阻碍作用的常见威胁

2. 介绍如何克服这些威胁

3. 使您能够使用 Minitab Engage™运行自己的改进项目

让我们从制造稳定性的简要概述开始。

什么是生产稳定性?

生产稳定性是组织在任何给定时间段内保持其生产水平的能力。

什么是精益制造稳定性?

在精益制造中,稳定性一词用于描述可以使用相同的材料、设备和人员重复进行的生产过程。如果拥有稳定的过程,则将在可预测的时间范围内以最少的浪费支持高质量的输出。稳定性与变异相反,变异会对上述能力产生负面影响。

如何改进制造业中的生产稳定性

下面,我们将概述一些对稳定性的常见威胁,以及为贵组织解决这些威胁的方法。

威胁 1:标准化与人性

跨团队产生想法、合作开发数据驱动型解决方案以及使用强健的方法来识别变异源都需要经过验证的标准化工具。

不幸的是,人类的一些自然倾向会给团队带来问题和混淆:

• 在定义问题和范围之前跳转到解决方案。

• 在完成当前项目并解决手头问题之前,过快地转移到下一个问题。

• 主要基于主观臆测(而不是数据和铁证)提出潜在的解决方案。

• 开始分析数据而不检查其质量(包括数据的收集和测量方式)。

为了避免这些常见的缺陷,实施具有久经验证的可靠记录的方法将有助于团队分享共同的观点。例如,为了帮助您有效地解决复杂问题,DMAIC 方法具有以下标准化阶段:定义、测量、分析、改进和控制。它将问题划分为更便于管理的较小阶段,并使用包含多种强大工具的工具箱。我们最新的端到端改进解决方案 Minitab Engage 中提供了 DMAIC 以及其他问题解决方法。

确保项目遍历方法的所有步骤需要遵循一定的准则。幸运的是,Minitab Engage 通过阶段审查和审批、控制台报告和电子邮件通知随时跟踪您的项目。

威胁 2:公差

通常不可能完全消除过程中的变异。难以管理的紧公差通常会导致组织的最终成本增加。如果(在设计阶段)从一开始就没有充分考虑到这种威胁,制造厂家将难以实现其预期绩效。

随着供应链在全球范围内不断扩张,供应商力求完成更大的订单,供应商排名的一个关键标准是是否有能力保持在关键参数的规格限内。

威胁 3:稳定性 = 竞争优势

公司不断鼓励其供应商更好地控制其过程的稳定性。每当不稳定性在供应商之间传递并最终在客户之间传递时,因此导致的成本就会增加。在制造过程中很晚才检测到缺陷,这就是为什么可预测的可靠供应商能够在竞争中获得主要优势并与大客户建立长期盈利关系的原因。

威胁 4:缺乏跨部门协作

稳定性改进通常涉及到解决复杂问题以识别会直接影响变异性的关键因素。解决此类问题通常需要生产、质量和设计等多个部门的协作。这些部门通常对稳定性问题有不同的看法。

为了改进这种情况,每个部门都可能会尝试实施各自的专门解决方案,不同团队的解决方案将有差异。通常,这些解决方案包括 Excel 文件,其中包含尚未在公司范围内验证的计算和方法,这可能会降低凝聚力。

幸运的是,Minitab Engage 是一款经过精心设计的绝佳解决方案,可帮助组织以协作方式构建改进和创新计划并借助问题解决工具和久经验证的项目管理方法执行这些计划。 收起阅读 »

创建蒙特卡洛模拟的 4 个简单步骤

20 世纪 40 年代,研究原子弹的科学家应用 Monte Carlo 模拟计算了一个裂变铀原子引起另一个裂变反应的概率,这是该模拟的首次应用,自此以来已经取得...
20 世纪 40 年代,研究原子弹的科学家应用 Monte Carlo 模拟计算了一个裂变铀原子引起另一个裂变反应的概率,这是该模拟的首次应用,自此以来已经取得了很大进展。今天我们将介绍如何使用 Minitab 为已知的工程公式和 DOE 方程创建 Monte Carlo 模拟。

由于当时铀供应短缺,试验的试错空间很小,因此 Monte Carlo 模拟一直专注于根据模拟数据计算可靠的概率。如今,从材料工程到医疗设备包装密封再到炼钢,模拟数据经常用于许多场景,例如资源有限的场景,或者收集真实数据过于昂贵或不切实际的场景。使用 Engage 或 Workspace 的 Monte Carlo 模拟工具可以:

(1)模拟可能结果的范围以帮助做出决策

(2)预测财务结果或估计项目时间表

(3)了解过程或系统中的变异性

(4)在过程或系统中发现问题

(5)通过了解成本/效益关系来管理风险

开始使用任何 Monte Carlo 模拟的4 个步骤

模拟可能非常复杂,具体取决于所涉及因子的数量。但所有 Monte Carlo 模拟基本上都有四个简单的步骤:

• 确定传输方程

要创建 Monte Carlo 模拟,您需要一个包含要探索的业务活动、计划或过程的定量模型。过程的数学表达式称为“传输方程”。这可以是已知的工程或业务公式,也可以基于根据设计试验 (DOE) 或回归分析创建的模型。借助 Minitab Engage 和 Minitab Workspace 等软件,您能够创建复杂的方程,甚至是具有多个可能相互依赖的响应的方程。

• 定义输入参数

对于传输方程中的每个因子,确定其数据的分布方式。一些输入可能遵循正态分布,而另一些则遵循三角分布或均匀分布。然后,您需要确定每个输入的分布参数。例如,需要为遵循正态分布的输入指定均值和标准差。如果您不确定数据遵循哪种分布,可以使用 Engage 和 Workspace 提供的工具来确定。

• 设置模拟

要进行有效的模拟,您必须为每个输入创建一个非常大的随机数据集(大约包含 100,000 个实例)。这些随机数据点模拟在很长一段时间内,对于每个输入将看到的值。尽管听起来工作量很大,但这正是 Engage 和 Workspace 的亮点。一旦我们提交输入和模型,一切都会得到处理。

• 分析过程输出

有了模拟数据,您就可以使用传输方程来计算模拟结果。考虑到输入中的预期变异,通过模型运行足够多的模拟输入数据将可靠地指出该过程将在一段时间内输出的内容。

Monte Carlo 使用已知工程公式的4 个步骤

一家制造公司需要评估所提议产品的设计,这是一款每分钟必须泵送 12 毫升流体的小型活塞泵。考虑到活塞直径 (D)、冲程长度 (L) 和每分钟冲程数 (RPM) 的自然变异,您想要估计数千个泵的可能性能。理想情况下,数千个泵的泵流量将具有不大于 0.2 毫升的标准差。

• 确定传输方程

进行 Monte Carlo 模拟的第一步是确定传输方程。在本例中,您只需使用已知的工程公式来测量泵流量:

流量(以毫升为单位)= π(D/2)2 ∗ L ∗ RPM

• 定义输入参数

现在,必须定义传输方程中使用的每个输入的分布和参数。泵的活塞直径和冲程长度是已知的,但必须计算达到所需 12 毫升/分钟流速所需的每分钟冲程数 (RPM)。每个冲程泵送的体积按以下方程计算:π(D/2)2 * L

如果 D = 0.8,L = 2.5,则每个冲程排出 1.256 毫升流体。因此,要达到 12 毫升/分钟的流速,RPM 为 9.549。

根据贵厂制造的其他泵的性能,您可以假定活塞直径呈正态分布,均值为 0.8 厘米,标准差为 0.003 厘米。冲程长度呈正态分布,均值为 2.5 厘米,标准差为 0.15 厘米。最后,每分钟冲程数呈正态分布,均值为 9.549 RPM,标准差为 0.17 RPM。

• 在 Engage 或 Workspace 中设置模拟

单击顶部功能区中的插入选项卡,然后选择 Monte Carlo 模拟。

图片1.png


我们将它变得非常简单 — 您只需为每个变量提供名称,从下拉菜单中选择一个分布,然后输入参数。我们将按照上面所述的内容进行操作。如果您不确定数据遵循哪种分布,可以选择使用数据确定。这将提示您上传数据的 .csv 文件,可从以下几个选项中进行选择:

图片2.png


图片3.png


• 模拟和分析过程输出

下一步是给出方程。在这里,操作非常简单,只需为您的输出提供名称(我们提供的名称是 Flow),然后键入我们在上面确定的正确传输方程。您还可以添加规格上限和规格下限以查看模拟的比较情况。

图片4.png


然后,在功能区中,选择要运行的模拟数量(100,000 是不错的基准),然后单击用来运行模拟的按钮。

图片5.png


对于为了撰写本文而生成的随机数据,基于 100,000 个样本的平均流速为 11.996。从平均值来看,我们达到了目标,但最小值为 8.7817,最大值为 15.7057。这是一个相当大的范围。(所有组件的)传输变异导致标准差为 0.756 毫升,这远远超过目标值 0.2 毫升。

看起来这种泵的设计变异太大,需要在投入生产之前进一步完善。从这里,我们看到模拟所带来的好处。如果我们直接投入生产,很可能会生产出太多被退货的泵。借助 Monte Carlo 模拟,我们能够解决所有这些问题,而不会因制造和测试数千个原型或过早投入生产而产生费用。

图片6.png


您可能想了解这些模拟结果是否站得住脚,不妨自己尝试一下吧!运行不同的模拟将导致轻微的变化,但每次的最终结果(流速变异量不可接受)都会保持一致。这就是 Monte Carlo 方法的强大之处。

另一个可选步骤:参数优化

了解到标准差过高非常有价值,但 Engage 和 Workspace 真正突出的地方在于它们能够帮助改善状况。这就是参数优化的用武之地。

让我们看看第一个输入:活塞直径。平均值为 0.8,大部分数据将接近该值,或者在平均值的一两个标准差内。但是,如果活塞直径越小,流动效率越高,该怎么办?参数优化有助于我们回答这个问题。

为了进行参数优化,我们需要为每个输入指定搜索范围。在本例中,为简单起见,我指定的算法搜索范围是 +/- 3 个标准差。然后,Engage 或 Workspace 将帮助我们为每个输入找到要实现目标(在本例中是减小标准差)的最佳设置。选择合适的范围至关重要;确保您输入的整个范围都可以运行;如果找到的最佳解决方案无法在生产环境中复制,则毫无用处。

图片7.png


如果您在 Minitab Statistical Software 中用过响应优化器,则原理类似。下面是我们的结果:

图片8.png


基于以上结果,如果要减小标准差,则应当减小冲程长度和每分钟冲程数。活塞直径可以保持类似大小。请记住,Monte Carlo 模拟的关键之处在于,能够在不构建单个新原型或进行新试验的情况下找出所有这些结果。

Monte Carlo 使用试验设计 (DOE) 响应方程

如果您不知道要使用什么方程,或者您正在尝试模拟独特过程的结果,该怎么办?此时,我们可以将 Minitab Statistical Software 的设计试验功能与 Engage 或 Workspace 的模拟功能相结合。

一家电子制造商已指派您改进其电极清洁操作,该操作为电镀金属部件做准备。制造商通过电镀在原材料上涂上一层不同的金属,以实现所需的特性。电镀不会附着在肮脏的表面上,因此该公司有一个连接到自动电镀机的连续流电极清洗系统。传送带将每个部件浸入槽中,槽中的电压通过部件传送,从而对部件进行清洁。如果清洁不充分,会导致平均粗糙度的均方根(简称 RMS)值太高以及表面光洁度较差。经过正确清洁的部件具有光滑的表面和较低的 RMS。

为了优化该过程,可以调整两个关键输入:电压 (Vdc) 和电流密度 (ASF)。对于电极清洁方法,Vdc 的典型工程限值为 3 至 12 伏。电流密度限值为 10 至 150 安培/平方英尺 (ASF)。

• 确定传输方程

您不能针对该过程使用教材上的已知公式,但可以在 Minitab 中设置响应曲面 DOE 以确定传输方程。响应曲面 DOE 通常用于通过为“关键少数”可控因子寻找最佳设置来优化响应。

在本例中,响应将是部件在清洁后的表面质量。

要在 Minitab 中创建响应曲面试验,请选择统计 > DOE > 响应曲面 > 创建响应曲面设计。由于我们有两个因子(电压 (Vdc) 和电流密度 (ASF)),因此我们将选择试验次数为 13 的双因子中心复合设计。

图片9.png


Minitab 创建设计试验后,您需要执行 13 次试验、收集数据并记录 13 个清洁后部件的表面粗糙度。通过 Minitab,可轻松分析 DOE 结果、简化模型和使用残差图检查假定。使用最终模型和 Minitab 的响应优化器,可以找到变量的最佳设置。在本例中,您将电压设置为 7.74,将 ASF 设置为 77.8,所获得的粗糙度值为 39.4。

响应曲面 DOE 为 Monte Carlo 模拟生成以下传输方程:

粗糙度 = 957.8 − 189.4(Vdc) − 4.81(ASF) + 12.26(Vdc2) + 0.0309(ASF2)

• 定义输入参数

现在,您可以为Monte Carlo模拟输入设置参数定义,并将它们带入Engage或Workspace 中。

请注意,标准差必须已知或基于现有的过程知识进行估计。这适用于所有 Monte Carlo 输入。电压呈正态分布,均值为 7.74 Vdc,标准差为 0.14 Vdc。每平方英尺安培数 (ASF) 呈正态分布,均值为 77.8 ASF,标准差为 3 ASF。

• 在 Engage 或 Workspace 中设置模拟

这与步骤 3 完全相同。单击功能区中的插入 > Monte Carlo 模拟,添加您的输入并定义其参数,然后输入您的模型。在本例中,如果您拥有最新版本的 Minitab,则可以单击鼠标右键,然后点击发送到 Engage 或发送到 Minitab Workspace。如果您没有,则可以从 Minitab 输出中手动复制它并将其粘贴到 Engage 或 Workspace 的模型字段中。

• 模拟和分析过程输出

汇总表明,即使基础输入呈正态分布,RMS 粗糙度的分布也不是正态的。该汇总还显示所有组件的传输变异导致标准差为 0.521,根据您掌握的过程知识判断,这是不错的过程结果。基于试验次数仅为 13 的 DOE,我们可以确定在该过程中将看到的实际情况。同样,由于这基于模拟数据,您的答案会略有不同,但通常而言答案应该是正确的。如有必要,我们可以查看参数优化以微调我们的答案并找到最佳解决方案。 收起阅读 »

使用 Engage 或 Workspace 创建 Monte Carlo 模拟的 4 个简单步骤

20 世纪 40 年代,研究原子弹的科学家应用 Monte Carlo 模拟计算了一个裂变铀原子引起另一个裂变反应的概率,这是该模拟的首次应用,自此以来已经取得...
20 世纪 40 年代,研究原子弹的科学家应用 Monte Carlo 模拟计算了一个裂变铀原子引起另一个裂变反应的概率,这是该模拟的首次应用,自此以来已经取得了很大进展。今天我们将介绍如何使用 Minitab 为已知的工程公式和 DOE 方程创建 Monte Carlo 模拟。

由于当时铀供应短缺,试验的试错空间很小,因此 Monte Carlo 模拟一直专注于根据模拟数据计算可靠的概率。如今,从材料工程到医疗设备包装密封再到炼钢,模拟数据经常用于许多场景,例如资源有限的场景,或者收集真实数据过于昂贵或不切实际的场景。使用 Engage 或 Workspace 的 Monte Carlo 模拟工具可以:

(1)模拟可能结果的范围以帮助做出决策。

(2)预测财务结果或估计项目时间表。

(3)了解过程或系统中的变异性。

(4)在过程或系统中发现问题。

(5)通过了解成本/效益关系来管理风险。

开始使用任何 Monte Carlo 模拟的 4 个步骤

模拟可能非常复杂,具体取决于所涉及因子的数量。但所有 Monte Carlo 模拟基本上都有四个简单的步骤:

1.确定传输方程

要创建 Monte Carlo 模拟,您需要一个包含要探索的业务活动、计划或过程的定量模型。过程的数学表达式称为“传输方程”。这可以是已知的工程或业务公式,也可以基于根据设计试验 (DOE) 或回归分析创建的模型。借助 Minitab Engage 和 Minitab Workspace 等软件,您能够创建复杂的方程,甚至是具有多个可能相互依赖的响应的方程。

2.定义输入参数

对于传输方程中的每个因子,确定其数据的分布方式。一些输入可能遵循正态分布,而另一些则遵循三角分布或均匀分布。然后,您需要确定每个输入的分布参数。例如,需要为遵循正态分布的输入指定均值和标准差。如果您不确定数据遵循哪种分布,可以使用 Engage 和 Workspace 提供的工具来确定。

3.设置模拟

要进行有效的模拟,您必须为每个输入创建一个非常大的随机数据集(大约包含 100,000 个实例)。这些随机数据点模拟在很长一段时间内,对于每个输入将看到的值。尽管听起来工作量很大,但这正是 Engage 和 Workspace 的亮点。一旦我们提交输入和模型,一切都会得到处理。

4.分析过程输出

有了模拟数据,您就可以使用传输方程来计算模拟结果。考虑到输入中的预期变异,通过模型运行足够多的模拟输入数据将可靠地指出该过程将在一段时间内输出的内容。

Monte Carlo 使用已知工程公式的 4 个步骤

一家制造公司需要评估所提议产品的设计,这是一款每分钟必须泵送 12 毫升流体的小型活塞泵。考虑到活塞直径 (D)、冲程长度 (L) 和每分钟冲程数 (RPM) 的自然变异,您想要估计数千个泵的可能性能。理想情况下,数千个泵的泵流量将具有不大于 0.2 毫升的标准差。

1.确定传输方程

进行 Monte Carlo 模拟的第一步是确定传输方程。在本例中,您只需使用已知的工程公式来测量泵流量:

流量(以毫升为单位)= π(D/2)2 ∗ L ∗ RPM

2.定义输入参数

现在,必须定义传输方程中使用的每个输入的分布和参数。泵的活塞直径和冲程长度是已知的,但必须计算达到所需 12 毫升/分钟流速所需的每分钟冲程数 (RPM)。每个冲程泵送的体积按以下方程计算:

π(D/2)2 * L

如果 D = 0.8,L = 2.5,则每个冲程排出 1.256 毫升流体。因此,要达到 12 毫升/分钟的流速,RPM 为 9.549。

根据贵厂制造的其他泵的性能,您可以假定活塞直径呈正态分布,均值为 0.8 厘米,标准差为 0.003 厘米。冲程长度呈正态分布,均值为 2.5 厘米,标准差为 0.15 厘米。最后,每分钟冲程数呈正态分布,均值为 9.549 RPM,标准差为 0.17 RPM。

3.在 Engage 或 Workspace 中设置模拟

单击顶部功能区中的插入选项卡,然后选择 Monte Carlo 模拟。

图片1.png


我们将它变得非常简单 — 您只需为每个变量提供名称,从下拉菜单中选择一个分布,然后输入参数。我们将按照上面所述的内容进行操作。如果您不确定数据遵循哪种分布,可以选择使用数据确定。这将提示您上传数据的 .csv 文件,可从以下几个选项中进行选择:

图片2.png


图片3.png


4.模拟和分析过程输出

下一步是给出方程。在这里,操作非常简单,只需为您的输出提供名称(我们提供的名称是 Flow),然后键入我们在上面确定的正确传输方程。您还可以添加规格上限和规格下限以查看模拟的比较情况。

图片4.png


然后,在功能区中,选择要运行的模拟数量(100,000 是不错的基准),然后单击用来运行模拟的按钮。

图片5.png


对于为了撰写本文而生成的随机数据,基于 100,000 个样本的平均流速为 11.996。从平均值来看,我们达到了目标,但最小值为 8.7817,最大值为 15.7057。这是一个相当大的范围。(所有组件的)传输变异导致标准差为 0.756 毫升,这远远超过目标值 0.2 毫升。

看起来这种泵的设计变异太大,需要在投入生产之前进一步完善。从这里,我们看到模拟所带来的好处。如果我们直接投入生产,很可能会生产出太多被退货的泵。借助 Monte Carlo 模拟,我们能够解决所有这些问题,而不会因制造和测试数千个原型或过早投入生产而产生费用。

图片6.png


您可能想了解这些模拟结果是否站得住脚,不妨自己尝试一下吧!运行不同的模拟将导致轻微的变化,但每次的最终结果(流速变异量不可接受)都会保持一致。这就是 Monte Carlo 方法的强大之处。

另一个可选步骤:参数优化

了解到标准差过高非常有价值,但 Engage 和 Workspace 真正突出的地方在于它们能够帮助改善状况。这就是参数优化的用武之地。

让我们看看第一个输入:活塞直径。平均值为 0.8,大部分数据将接近该值,或者在平均值的一两个标准差内。但是,如果活塞直径越小,流动效率越高,该怎么办?参数优化有助于我们回答这个问题。

为了进行参数优化,我们需要为每个输入指定搜索范围。在本例中,为简单起见,我指定的算法搜索范围是 +/- 3 个标准差。然后,Engage 或 Workspace 将帮助我们为每个输入找到要实现目标(在本例中是减小标准差)的最佳设置。选择合适的范围至关重要;确保您输入的整个范围都可以运行;如果找到的最佳解决方案无法在生产环境中复制,则毫无用处。

图片7.png


如果您在 Minitab Statistical Software 中用过响应优化器,则原理类似。下面是我们的结果:

图片8.png


基于以上结果,如果要减小标准差,则应当减小冲程长度和每分钟冲程数。活塞直径可以保持类似大小。请记住,Monte Carlo 模拟的关键之处在于,能够在不构建单个新原型或进行新试验的情况下找出所有这些结果。

Monte Carlo 使用试验设计 (DOE) 响应方程

如果您不知道要使用什么方程,或者您正在尝试模拟独特过程的结果,该怎么办?此时,我们可以将 Minitab Statistical Software 的设计试验功能与 Engage 或 Workspace 的模拟功能相结合。

一家电子制造商已指派您改进其电极清洁操作,该操作为电镀金属部件做准备。制造商通过电镀在原材料上涂上一层不同的金属,以实现所需的特性。电镀不会附着在肮脏的表面上,因此该公司有一个连接到自动电镀机的连续流电极清洗系统。传送带将每个部件浸入槽中,槽中的电压通过部件传送,从而对部件进行清洁。如果清洁不充分,会导致平均粗糙度的均方根(简称 RMS)值太高以及表面光洁度较差。经过正确清洁的部件具有光滑的表面和较低的 RMS。

为了优化该过程,可以调整两个关键输入:电压 (Vdc) 和电流密度 (ASF)。对于电极清洁方法,Vdc 的典型工程限值为 3 至 12 伏。电流密度限值为 10 至 150 安培/平方英尺 (ASF)。

1.确定传输方程

您不能针对该过程使用教材上的已知公式,但可以在 Minitab 中设置响应曲面 DOE 以确定传输方程。响应曲面 DOE 通常用于通过为“关键少数”可控因子寻找最佳设置来优化响应。

在本例中,响应将是部件在清洁后的表面质量。

要在 Minitab 中创建响应曲面试验,请选择统计 > DOE > 响应曲面 > 创建响应曲面设计。由于我们有两个因子(电压 (Vdc) 和电流密度 (ASF)),因此我们将选择试验次数为 13 的双因子中心复合设计。

图片9.png


Minitab 创建设计试验后,您需要执行 13 次试验、收集数据并记录 13 个清洁后部件的表面粗糙度。通过 Minitab,可轻松分析 DOE 结果、简化模型和使用残差图检查假定。使用最终模型和 Minitab 的响应优化器,可以找到变量的最佳设置。在本例中,您将电压设置为 7.74,将 ASF 设置为 77.8,所获得的粗糙度值为 39.4。

响应曲面 DOE 为 Monte Carlo 模拟生成以下传输方程:

粗糙度 = 957.8 − 189.4(Vdc) − 4.81(ASF) + 12.26(Vdc2) + 0.0309(ASF2)

2.定义输入参数

现在,您可以为 Monte Carlo 模拟输入设置参数定义,并将它们带入 Engage 或 Workspace 中。

请注意,标准差必须已知或基于现有的过程知识进行估计。这适用于所有 Monte Carlo 输入。电压呈正态分布,均值为 7.74 Vdc,标准差为 0.14 Vdc。每平方英尺安培数 (ASF) 呈正态分布,均值为 77.8 ASF,标准差为 3 ASF。

3.在 Engage 或 Workspace 中设置模拟

这与步骤 3 完全相同。单击功能区中的插入 > Monte Carlo 模拟,添加您的输入并定义其参数,然后输入您的模型。在本例中,如果您拥有最新版本的 Minitab,则可以单击鼠标右键,然后点击发送到 Engage 或发送到 Minitab Workspace。如果您没有,则可以从 Minitab 输出中手动复制它并将其粘贴到 Engage 或 Workspace 的模型字段中。

4.模拟和分析过程输出

汇总表明,即使基础输入呈正态分布,RMS 粗糙度的分布也不是正态的。该汇总还显示所有组件的传输变异导致标准差为 0.521,根据您掌握的过程知识判断,这是不错的过程结果。基于试验次数仅为 13 的 DOE,我们可以确定在该过程中将看到的实际情况。同样,由于这基于模拟数据,您的答案会略有不同,但通常而言答案应该是正确的。如有必要,我们可以查看参数优化以微调我们的答案并找到最佳解决方案。

本文最初出现在Minitab博客上。 收起阅读 »

等价检验 VS 显著性检验

传统显著性检验用于推断样本所代表的总体均值是否相等,它的检验假设为样本来自同一总体(即总体均值相等)。在应用中,显著性检验结果不能评价差别的大小,也不能说明差别...
传统显著性检验用于推断样本所代表的总体均值是否相等,它的检验假设为样本来自同一总体(即总体均值相等)。在应用中,显著性检验结果不能评价差别的大小,也不能说明差别是否有实际意义,所谓差别显著是指在统计学理论上认为样本来自不同的总体。另外显著性检验在均值差异性比较中也存在一定的局限性,下面我们以双样本t检验为例来说明。

显著性检验的局限性

我们看到下表1中两种测试方法得到的数据,希望比较两种测试方法得到的结果是否一致(等效)。

图片1.png


可能首先想到的方法就是用双样本t检验,我们来试试看(前提条件验证略)。

图片2.png


图片3.png


图片4.png


双样本t检验的结果显示,P=0.001<0.05,所以我们得到的结论是:两种测试方法的结果是有显著性差异的。拒绝是有说服力的,所以我们也不用担心犯第二类错误。

现在我们再来看看下表2中两种测试方法的数据,也想来比较有没有显著性差异。

图片5.png


同理,我们也来执行双样本t检验(前提条件验证略),得到如下结果。

图片6.png


双样本t检验的结果显示,P=0.081>0.05,所以我们得到的结论是:两种测试方法的结果无显著性差异的,即不拒绝原假设。不拒绝是没有说服力的,可能是样本量不够导致的(建议做功效与样本量的计算)。

基于以上分析,总结如下:

图片7.png


但是,如果你仔细去看一看表1和表2中的数据,有没有发现表1中两种测试方法结果差异比较小(但双样本t检验结果P=0.001<0.05),表2中两种测试方法结果差异比较大(但双样本t检验结果P=0.081>0.05),注意,这不是错觉,这是t检验本身存在的局限性。

为什么这么说,我们以表2中数据(两总体标准差未知但相等)为例来看看t检验的基本原理。

图片8.png


图片9.png


T=2.32小于拒绝域临界值2.776,及检验统计量T落在非拒绝域(白色区域),故不拒绝原假设。换句话说,如果想拒绝原假设(得到两种测试方法有显著差异的结论),就需要检验统计量T值(绝对值)足够大,大到超过2.776,那么怎么做才能实现呢?通过后台公式我们能发现只需要:样本量足够大且/或合并标准差SP足够小。

图片10.png


其实这是一个有悖逻辑的发现,因为如果真的如此的话,那我以后直接选择摆烂不就可以吗(样本量少抽一点,测量变异搞大点,这样越不容易得到有显著差异)。

图片11.png


等价检验

从功能和实用意义上来讲,产品之间存在微小差异并不总是十分重要。例如,在200 mg的药物剂量中,相差1mg不会产生任何实际效应,那如果我想证明药物剂量不同对疗效是相同的或相近的,又该如何去验证呢?可不可以用显著性检验的方法(如t检验)?

显著性检验确定备择假设的方法是“想证明什么结论就把它放在备择假设上”,那能否把相等的结论放在备择假设上,如H0:μ≠μ0, H1: μ=μ0很遗憾,统计学中不可能处理这种“原假设是某个范围,而备择假设只是一个单点”的情况,只能处理备择假设为

H1:|μ-μ0|<△

H1: μ1<μ<μ2

其中μ1=μ0-△,μ2=μ0+△

这类检验问题称为等价检验(equivalence test)问题,也称等效性检验问题。其中(μ1,μ2)称为等价区间。它的原假设和备择假设为:

H0:μ<μ1或μ>μ2 H1:μ1≤μ≤μ2

等价检验实际上是双单侧假设检验(TOST),当左右两边的原假设同时被拒绝时才能认为原假设不成立。

图片12.png


等价检验 VS 显著性检验

图片13.png


等价检验与显著性检验比较如上图,下面我们通过一个具体案例来说明一下(案例来自于蓝皮书第三版P161)。

示例:在焊接电路板的过程中,焊锡膏的涂抹厚度是关键的控制量之一。工艺标准要求涂抹厚度的均值是60微米,均值偏差在5微米内。现在收集了25个焊点上的焊锡膏涂抹厚度。我们希望验证,涂抹厚度均值是60微米吗?涂抹厚度均值是落在(55,65)之内吗?

图片14.png


我们先来看看如果是用显著性检验(单样本t检验)会得到什么结果。

图片15.png


图片16.png


图片17.png


由于P值为0.111,因此无法拒绝原假设,也就是说没有充分的理由否认焊锡膏涂抹厚度均值为60。但“不否认”还不是明确的说明“均值就是60微米”的有说服力的结论。如果需要进一步确定“均值就是60微米”,或者更进一步判断其均值是否落入(55,65),则只能使用单样本等价检验方法(注意:即使是等价检验对于备择假设只是一个单点也是无能为力的)。

图片18.png


图片19.png


图片20.png


图片21.png


图片22.png


正如Minitab告诉你的,不能认为是等价的,即焊锡膏涂抹厚度均值可以认为是60微米,但未落在(55,65)之内,即精确度未达到误差小于5微米的水平。

那如果允许误差放大些,比如说(50,70),结果就可以认为是等价的了。

图片23.png


请注意,我在这里不得不说明一下,千万不要说为了得到等价的结论而去改等价区间,我在这里修改只是为了说明问题,我们在实际工作一定是要事先指定好等价区间范围(防止扯皮)。

小结

要在等价检验和标准t检验之间进行选择,请考虑您希望证明或说明的内容。如果您希望证明两个均值相等或者证明均值等于目标值,而且您可以确切地定义在所属领域中属于重要差值的差值大小,则您可能希望使用等价检验,而不是标准t检验。 收起阅读 »

防止缺货和优化库存水平的三个步骤

和大多数的问题解决方法一样,优化库存需要一个考虑周全的过程和几个步骤。当然,防止缺货的最简便方法是手头始终具有大量库存。然而,不优化库存也会产生难以预料的后果。...
和大多数的问题解决方法一样,优化库存需要一个考虑周全的过程和几个步骤。当然,防止缺货的最简便方法是手头始终具有大量库存。然而,不优化库存也会产生难以预料的后果。过度生产和保持过高的库存水平可能会导致产品变质甚至腐坏。库存过剩不仅会在当下产生成本,而且当您需要生产更多商品来替换货架上放置时间过长的产品时,还会在以后产生隐性成本。

可通过多种方法来计算优化(将在下面解释),但优化库存的关键在于三个主要步骤:对影响库存的因素进行头脑风暴分析、收集数据并分析数据。在深入研究每个步骤之前,我们先来介绍一些有关缺货的基本知识。

什么是缺货?是什么原因造成的?
简单地说,缺货意味着由于产品不在库存中而无法履行或交付。这可能是因为产品需求量高于预期,或者因库存水平太低而无法满足当前需求。

缺货是否对企业不利?
用一个字概括,是。我们都属于各种各样的客户,当所需的产品或服务不可用时,我们都会有不好的感觉。这不仅会损害当前客户体验,而且会对您的品牌和客户关系产生长期影响。

因此...如何减少缺货?防止缺货的三个步骤如下

对影响缺货的因素(包括库存水平)进行头脑风暴分


防止缺货的最大因素是现有的库存水平。如果库存中没有足够的产品,将面临缺货。但现有库存只是一个因素。您还需要了解影响移动供应链的所有因素(如在途库存、销售额预测、历史销售业绩),甚至还需要了解您自己的供应商所带来的影响。

因此,如何保持库存水平足够高以满足客户需求,但又足够低以避免库存过剩?您需要对影响库存水平的因素进行头脑风暴分析。使用结构化的问题解决工具(如 CT 树或鱼骨图)可以让您获得成功。

下面是一个头脑风暴工具示例,该示例使用 Minitab Workspace 中的鱼骨图。

Inventory_Blog_Workspace.png


收集数据

一旦确定了影响缺货的关键因素,就需要收集有关这些因素的数据。请注意,可能需要从多个来源和系统收集库存数据,而且数据的请求和准备过程可能需要一些时间。考虑需要收集的数据量。
例如,考虑到一段时间发生的所有变化,若追溯到 5 年前可能太久了。收集几个月的数据可能更合理,所以请根据您的最佳判断来捕获您的过程的代表性快照。您可以请 IT 部门协助,或利用功能强大的数据统一工具(如 Minitab Connect)访问、集成和准备要分析的数据。

使用预测分析来分析数据

收集到数据之后,就可以开始进行最有趣的部分:分析!传统的业务分析和可视化技术在这方面可能存在不足,因为最有可能出现的直观效果是:现有库存越低,缺货量越大!由于我们已经知道这一点,因此我们真正想要确定的是:是否还有另一个重要因素是缺货的关键驱动因素?是否存在一个最佳库存水平既可最大限度地减少缺货,又不会造成积压和生产过剩?

因此,为什么要进行预测分析?简言之,设想创建一个方程,该方程将所有影响缺货的因素作为预测变量,并将缺货作为响应。就像高中代数一样,这些不同的因素有不同的权重,因此对结果的影响程度也不同。在 Minitab,我们开发了解决方案来专门帮助您解决这些问题! 收起阅读 »

假设检验的功效和样本数量

在假设检验中,我们会使用样本中的数据来描绘有关总体的结论。首先,我们会进行假设,这被称为原假设(以 H0 表示)。当您进行原假设时,您也需要定义备选假设 (Ha...
在假设检验中,我们会使用样本中的数据来描绘有关总体的结论。首先,我们会进行假设,这被称为原假设(以 H0 表示)。当您进行原假设时,您也需要定义备选假设 (Ha),其与原假设正相反。样本数据将用于判断 H0 是否可以被否定。如果其被否定,则统计结论将认为备选假设 Ha 正确。 

请记住这一检验的功效,或是在原假设不正确时,原假设被否定的可能性。

它可以解释为“检验在应该拒绝原假设时拒绝原假设的能力”。如果原假设不正确,则有很高概率拒绝原假设是很有意义的。功效与类型 2 的错误相关(功效 = 1 - 类型 2 错误),请见下表。类型 2 错误是当备选假设正确时不拒绝原假设的概率。因此,确保有足够高的功效,才能保证类型 2 错误较低或“可以接受”。确保检验有足够功效的一种常用方法是收集足够的数据,因为功效的计算取决于样本数量等因子。样本数量越大,功效越高。换言之,未能收集足够的数据将导致低功效和大量类型 2 错误。 

1.png


最重要的是要找到合适的样本数量。显而易见,未能收集足够的数据会导致更多的类型 2 错误。但是,收集“过多”的数据也会增加类型 1 错误,因为检验的功效会更高。因此,该检验可能会检测到与假设值的微小差异,即使该差异可能没有任何实际意义,尤其是与抽样成本有关时。检验功效的计算应当基于实际意义。 
MINITAB具有通过多种不同统计检验计算功效的功能

在下列示例中,分析人员在 Minitab 中通过单比率检验和单样本 t 检验,进行了功效和样本数量分析。 

单比率检验样本数量

考虑将产品分类为好或差的制造过程,其中有 1% 的不良品率。如果不良品率上升至 3%,则会对整个组织造成严重的成本问题。他们需要确定合适的样本数量,以满足:类型 I 错误率为 0.05,检验功效为 0.80,以检测出不良品率从 1% 上升至 3% 或更高。 
因为分析人员对不良品率研究感兴趣,他们使用了单比率检验。原假设和备选假设是: 
Ho: P = 0.01 
Ha: P > 0.01 
其中 P 为实际缺陷比率。
为了找出需要多少数据点才能达到至少0.8的功效,分析人员在 Minitab 中进行了单比率检验的功效和样本数量分析。 

2.png


单样本 t 检验的样本数量

将产品分类为好或差很简单,但会损失很多信息。将好产品视为在 5 到 10 之间。假如有 2 个单元测得的数值为 4.9 和 10.01,并因而归入差的分类。假如有另外 2 个单元测得的数值为 2.3 和 14.1,并因而归入差的分类。请注意,如果只是简单的区分好和差,这两种情况是相同的。因此,如果测量产品质量特征是可行的,那么分析人员应该记录质量特征的实际值,并使用记录的数据 – 无需转换为好和差。单样本 t 检验可以用于检验总体的均值是否与目标一致。如果样本数据的均值接近“目标”,则该过程可能运行良好。如果均值不接近目标,则可能生产出缺陷产品。 
 
例如,假设该产品特征为特定目标的孔直径。分析人员可以测量每个产品上的孔直径,并使用单样本 t 检验将均值与目标值进行比较,而不是检查 236 个产品以确定孔是否符合规格。 

为了找出需要多少数据点来检测至少 80% 功效的过程均值中的 1 西格玛偏移,分析人员在 Minitab 中对一个单样本 t 检验进行功效和样本数量分析。 

3.png


计算的样本数量仅为 10。这意味着如果分析人员希望确定目标的偏离均值是否超过了 1 西格玛,则他们需要进行 10 个单位的单样本 t 检验,以获得至少 80% 的功效。 

为什么会有这么大的区别?

属性数据的假设检验需要大量样本,因为在收集数据时没有获取详细信息。另一方面,连续数据的假设检验只需较少的样本数量,因为其获取并使用了产品的详细信息。该理论不仅适用于功效。属性数据需要大量样本以用于置信区间、属性一致性分析、控制图和能力分析。 

总之,重要的是进行具有足够功效的假设检验,以提供合理的机会来检测差异。功效与样本数量直接相关。Minitab 具有计算多种不同假设检验(包括试验设计)的功效的功能。 

本文最初出现在Minitab博客上。
收起阅读 »

如何使用流程图来抗击病毒并保障医疗人员的安全

有关新冠病毒的新闻报道遍布各大媒体。但并非所有的新闻都是坏消息。人类的意志坚不可摧,全球各地都在努力研发病毒疫苗。医疗系统正在经受着前所未有的考验。但是,面临困...
有关新冠病毒的新闻报道遍布各大媒体。但并非所有的新闻都是坏消息。人类的意志坚不可摧,全球各地都在努力研发病毒疫苗。医疗系统正在经受着前所未有的考验。但是,面临困境,依然有许多像Adventist HealthCare这样的组织在奋起抗击病毒。

1.jpg


利用卓越运营应对新冠病毒

总部位于盖瑟斯堡的 Adventist Healthcare 成立于1907年,是马里兰州蒙哥马利县的第一家(也是最大一家)医疗提供商。旗下的医疗系统包括四家医院、1,700多名医生和医疗人员、5,500多名员工以及由诸多医疗中心和设施组成的综合医疗网络,其服务不仅涵盖马里兰州,还覆盖华盛顿特区。

在美国确认新冠肺炎病例之后,Adventist HealthCare 卓越运营团队立即行动起来。他们组织了定期会议,力求在医生的领导以及其他多学科团队成员的参与下,组成过程设计和改进团队,共同分享有关此全球性新冠病毒的一切可用信息。世界卫生组织(WHO)和美国疾病防控中心(CDC)倡导增强卫生消毒方法以及严格限制身体接触,这让卓越运营团队意识到,只有更新医院和护理中心的现有诊治过程,才能更好地保护设施内的医疗人员和患者。

在 Melany Rabideau 的领导下,卓越运营团队在 Minitab Engage 中创建了一个项目,以期在单一位置记录与新冠病毒相关的所有过程。然后他们开始审查并确定哪些过程需要改进。

创建并更新过程,防止传染扩散

在弄清楚哪些过程需要改进以及需要创建哪些过程后,卓越运营团队立即展开行动。由于美国个人防护装备需求水涨船高,供应短缺,作为口罩供应稀缺时确保医疗人员安全的预防措施,卓越运营团队在 Minitab Engage 中创建了流程图,以确立在其所有设施中对N95口罩进行回收和消毒的标准化方法。

与任何优秀的流程图一样,卓越运营团队精心制定了完成过程所需的所有具体步骤,同时还添加了备注和颜色键来帮助医疗人员轻松快速地理解流程图。

以下是他们的流程图的数字版。

2.png


他们将流程图妥善分发到整个医疗系统中。但是,随着时间的推移,CDC 和 Adventist 领导层的指导方针发生了改变。

万幸的是,由于流程图是使用 Minitab Engage 创建,卓越运营团队中的任何人都可以根据需要进行编辑。团队成员非常喜欢这一点。他们将 Minitab Engage 当作“唯一参考信息源”和“中央存储库”,让所有团队成员都能在统一位置轻松获取相同的信息。

Adventist HealthCare 的脚步从未停歇

在当下全球疫情期间,Adventist HealthCare 创建了多张流程图来支持和帮助他们的医疗人员,针对 N95 口罩回收和消毒的流程图仅仅是其中之一。以下是他们与我们分享的其他两张流程图:

新冠肺炎疫情期间的紧急抢救响应
治疗导航 - 紧急治疗的调查病例 (PUI) 跟进过程


抗击新冠病毒正在如火如荼地进行,Adventist HealthCare 仍在不断创建新的流程图并予以更新,同时也在为其回归正轨做好规划准备。其中一名团队成员说得非常好:“Minitab Engage 在混乱时刻给予组织一种有条不紊的感觉。” 收起阅读 »

SPC 之 I-MR 控制图

概述   1924 年,美国的休哈特博士应用统计数学理论将 3Sigma 原理运用于生产过程中,并发表了著名的“控制图法”,对产品特性和过程变量进...
概述  
1924 年,美国的休哈特博士应用统计数学理论将 3Sigma 原理运用于生产过程中,并发表了著名的“控制图法”,对产品特性和过程变量进行控制,开启了统计过程控制新时代。 

什么是控制图 
控制图指示过程何时不受控制,有助于标识是否存在特殊原因变异。如果存在特殊原因变异,则说明过程不稳定且有必要采取纠正措施。 

图片1.png


控制图是按时间排序顺序绘制过程数据的图。大多数控制图都包括一条中心线、一个控制上限和一个控制下限。中心线表示过程均值。控制限表示过程变异。默认情况下,控制限绘制在中心线上下 3σ 的位置。 

随机位于控制限内的点指示过程受控制且仅显示常见原因变异。位于控制限外部或者显示非随机模式的点指示过程不受控制且存在特殊原因变异。

如何选择合适的控制图

随着控制图的发展,它的类型也是越来越多,那么这时候对于使用 Minitab 的朋友来说,经常会纠结如何去选择一个合适的控制图。在 Minitab 19 中,协助菜单可以很好的帮助我们去选择一个合适的控制图。

图片2.png


I-MR 控制图

图片3.png


今天,我们来绘制一下 I-MR 控制图。 

问题背景:某质量工程师监控了液体洗涤剂的生产过程,想要评估该过程是否受控制。这位工程师测量了 25 个连续批次的洗涤剂的 pH 值。

图片4.png


由于 pH 值的数据类型是连续型数据,而且是每批次只取一个样品(子组大小等于 1),故这位工程师创建了一张 I-MR 控制图,以监控洗涤剂的生产过程。

Minitab 绘制 I-MR 控制图

图片5.png


图片6.png


Minitab 结果解释

图片7.png


首先解释移动极差控制图(MR 控制图)以检查过程变异。没有位于控制限外部的点且所有的点都显示出随机模式。因此,过程变异受控制,质量工程师可以检查单值控制图(I 控制图)上的过程中心。

I 控制图上的一个观测值在检验 1 中失败,因为观测值在中心线上方且距离中心线超过 3个标准差。

I-MR 控制图的控制限计算(手动)  
对于 I-MR 控制图,包含两张图单值控制图(I 控制图)和移动极差控制图(MR 控制图), 我们首先来认识一下这两张图形上的 X 轴、Y 轴、点和线分别表示什么含义。

一、单值控制图(I 控制图) 
X 轴:批次 ID 
Y 轴:单值(每个批次对应的 pH 值,如单值图上的第二个点表示的是批次 2 的 pH 值)

图片8.png


图片9.png


点:单值控制图(I 控制图)上的每个标绘点是单独的观测值(如上图)。 
中心线:单值控制图(I 控制图)上的中心线是过程平均值的估计值,计算如下

图片10.png


图片11.png


图片12.png


控制限:单值控制图(I 控制图)控制限的计算结果取决于标准差的估计方式。

图片13.0_.png


1)移动极差平均值(默认方法)-移动极差长度默认为 2 
a. 计算移动极差 MR(相邻 2 个数的较大值减较小值),当前数据样本量为 25,计算得到24 个移动极差。 
b. 计算这 24 个移动极差的平均值 MRbar 
c. 估计标准差的公式如下: 

图片13.1_.png


控制限计算公式 

图片13.2_.png


其中 k 为检验 1 的参数。默认值为 3。

图片14.png


图片15.png


图片16.png


当选择默认的用移动极差平均值来估计标准差时,我们还可以勾选”使用 Nelson 估计值”。使用 Nelson 估计值可以在计算控制限时更正异常大的移动极差值。此过程与 Nelson1 提出的过程相似。Minitab 消除比移动极差平均值大 3σ 的任何移动极差值,然后重新计算移动极差平均值和控制限。

图片17.png


2)移动极差中位数
a. 计算移动极差
b. 计算移动极差中位数

图片18.1_.png


c. 估计标准差的公式如下: 

图片18.0_.png


图片19.png


图片20.png


二、移动极差控制图(MR 控制图) 
X 轴:批次 ID 
Y 轴:移动极差(如下 MR 控制图中的第二个点是批次 2 的 pH 值 5.99 和批次 3pH 值 6.11中较大值减去较小值,结果为 0.12(6.11-5.99) 

图片21.png


点:MR 控制图上的标绘点是移动极差(移动极差是两个或多个连续点之间差值的绝对值)。 
中心线:中心线是移动极差平均值的无偏估计值 MRbar 
控制上限:??? = (??(?) ⋅ ?) + (? ⋅ ??(?) ⋅ ?) 
控制下限:??? = (??(?) ⋅ ?) − (? ⋅ ??(?) ⋅ ?)或 LCL=0(计算结果为负值时) 
移动极差平均值法的结果

图片22.png


图片23.png


移动极差中位数法的结果

图片24.png


图片25.png


结论
手动计算的过程比较复杂,而且还可能会出错,但是有了 Minitab 的帮助,我们只需要选择好合适的控制图后,点击几下就可以高效快速的计算出对应的控制限。当然,花点时间手动计算一下这些值,能够帮助你更好的理解控制图。而且在计算的过程中,你也会发现 Minitab 的算法跟 Excel 中算法的差异,也能够发现单值控制图的控制限受到移动极差的影响,所以在分析这两张控制图时,应该先分析下面的移动极差控制图,移动极差控制图中没有异常点时,这时候分析单值控制图才是有意义的。
X 轴:批次 ID
Y 轴:移动极差(如下 MR 控制图中的第二个点是批次 2 的 pH 值 5.99 和批次3pH 值 6.11 中较大值减去较小值,结果为 0.12(6.11-5.99) 收起阅读 »

在 Minitab 中进行扩展量具 R&R 研究

量具 R&R 研究可以告诉您测量系统生成的数据是否值得信赖。遗憾的是,严格的数据要求和其他限制可能会让量具 R&R 研究难以进行分析,并可能无法...
量具 R&R 研究可以告诉您测量系统生成的数据是否值得信赖。遗憾的是,严格的数据要求和其他限制可能会让量具 R&R 研究难以进行分析,并可能无法解释所有重要因子。Minitab 中的扩展量具 R&R 工具能够使这些障碍成为过去。

量具 R&R 研究可以告诉您什么?

• 您的测量系统是否足够灵敏?

• 您的测量工具是否一致?

• 进行测量的人是否一致?

扩展量具 R&R 能提供哪些额外优势?

• 不仅要分析部件和操作员,还要分析多达八个其他因子。

• 甚至不完整的数据也可以进行分析(不平衡研究)。

• 包括固定或随机因子,获得更好的灵活性。

在量具 R&R 研究中包含两个以上的因子

通常,量具 R&R 研究只关注两个因子:部件和操作员。但是如果您知道其他因子也会影响您的测量系统呢?如果您不纳入这些因子,则将永远无法了解它们对测量变异性有多大影响,以及您的测量系统可能看起来比实际情况更好还是更差。Minitab 的扩展量具 R&R 能让您纳入最多八个额外的因子,用于调查并评估所有可能影响测量系统的因子。

例如

因为他们在繁忙的生产车间工作,检验人员担心生产速度的变化会影响他们的测量能力。加入生产线速度作为量具研究的因子,揭示出生产线速度变化对测量的影响甚至超出他们的预期。

图片2.png


以不完整或不平衡的数据进行量具 R&R

量具 R&R 研究可以要求严格的“平衡”设计,尽管实际上数据的收集通常并不完美。也许在研究中让操作员将所有部件测量相同的次数并不可行,或者可能一些测量数据已经丢失。扩展量具 R&R 允许您分析测量系统,即使有这样不平衡的数据,也无需手动计算来解释丢失的数据。

图片3.png


包括固定或随机因子以获取更高的灵活性

在量具研究中,如果您有意选择了一定的兴趣级别(比如最有经验和最缺乏经验的操作员),则该因子是固定的。如果您随机选择了级别来代表总体,则该因子为随机。常见量具研究会在所有因子均为随机的基础上计算结果。但将固定因子视为随机因子可能导致过度或低估其重要性。

扩展量具 R&R 允许您指明哪些因子是固定的,哪些是随机的,以便更好更妥当地评估您的测量系统。

例如

审核显示,退回精密铣削设施的大部分不合规格部件可追溯到两名经验最少的检验员。为了更好的理解该问题,质量经理希望能重点关注这些特定操作员后续的量具研究。因为人工挑选的这些操作员无法反应出随机抽样,所以在分析该研究时,经理将这一因子指定为固定因子。

图片4.png


MINITAB 让量具 R&R 更简单

如果您尚未利用 Minitab 的强大功能从数据中获取最大价值,请立即下载功能完备的 Minitab 30 天免费试用版。

本文最初出现在Minitab博客上。

图片5.png


图片6.png
收起阅读 »

样本量大于30就可以认为是正态分布吗?你可能对中心极限定理有误区!

我经常会被问到这么一个问题:样本量多大就不用进行正态性检验了。殊不知,这问题的本身就是错误的,并不是样本大,就一定要服从正态分布。我们可以轻易举出一个反例来说明...
我经常会被问到这么一个问题:样本量多大就不用进行正态性检验了。殊不知,这问题的本身就是错误的,并不是样本大,就一定要服从正态分布。我们可以轻易举出一个反例来说明这个问题。比方说就用1-1000这一千个(甚至更多)自然数,组成一个样本,那么这个样本的分布就不是正态分布,因为1-1000服从的是均匀分布。另外,数据的分布基于形成的机理,有的分布天生就非正态(如寿命数据)。

但有些朋友,并不觉得这是一个错误的问题,甚至在他们的学习中还流传着这么一个说法:样本量大于30就可以认为是服从正态分布。当你向他问为什么的时候,会得到一个专业的解释——中心极限定理。

中心极限定理

中心极限定理(Central Limit Theorem)是统计学中最重要的结论之一。在这里,我并不想给出中心极限定理专业的定义,只需要了解它告诉我们:来自某总体的一个样本,无论该总体服从什么分布,只要样本容量足够大,其样本均值都近似服从正态分布。

请注意这里的说法:“样本均值“近似正态,而不是样本本身服从正态(不是说你抽了30个样品组成的样本数据就正态)。这里又有一个大家疑惑的地方,样本容量足够大,多大才是足够大?这个问题的答案和总体分布的形状相关,如果样本本是来自近似对称分布的总体,那么当样本量取相当小(如样本量取5)的值的时候,正态逼近的结果也会非常好。然后,如果总体的分布严重倾斜,则样本量必须取相当大的值。根据检验,对于大多数总体来说,样本容量取30或者更大,就足以得到令人满意的正态逼近结果。我想这可能就是错误认为样本量大于30就认为是正态分布的出处了。

模拟掷骰子展示中心极限定理

为了展示中心极限定理,模拟多次投掷骰子来说明。

假设您掷骰子 1000 次。您希望得到相等数目的 1、2 等。让我们查看 1000 次骰子的分布(图1)。

图片1.png


现在假设您将投掷 2 次,并采用两次投掷的平均值。您还将重复此试验 1000 次。让我们来看看两次投掷的平均值的分布。这种分布如图 2 所示。您是否注意到在只进行了两次投掷的情况下,平均值的分布已经呈现出了土堆形?

图片2.png


假设您现在投掷骰子三次,然后取三次投掷的平均值。再次重复此试验 1000 次。让我们来看看此举对投掷的平均值分布有何影响。这种分布如图 3 所示。同样,分布的形状与正态分布的形状相当接近。您是否注意到分布上发生了其他变化?

图片3.png


让我们投掷骰子五次,并取其平均值。再次重复此试验 1000 次。这种分布如图 4 所示。您是否已开始注意到所发生的情形中存在任何模式?

图片4.png


让我们继续增加平均投掷次数。此时您将投掷 10 次,并采用 10 次投掷的平均值。这种分布如图 5 所示。

图片5.png


现在,随着您增加投掷次数,将看到两个现象。首先,您会看到,平均分布的形状开始与正态分布的形状相似。其次,您会看到,随着投掷次数的增加,分布变得越来越窄。让我们继续增加投掷次数。此时,您将投掷骰子 20 次。这种分布如图 6 所示。

图片6.png


到现在,您应该确信增大样本数量对样本平均值分布是有影响的。您将再次增大样本数量,以强化这种认知。此时,您将投掷骰子 30 次。这种分布如图 7 所示。

图片7.png


让我们看看所呈现的情况,在一个图中绘制大小为 2、5、10、20、30 的样本的直方图,以查看变化的分布。

从上面的模拟结果,可以知道,当样本量大于30的时候,那么样本均值(取了1000次样本,得到1000个均值)的分布基本呈正态分布。

另外该定理还指出,如果根据总体不断重复绘制随机样本数量 n 以及有限均值 mu(y) 和标准差 sigma(y),然后在 n 较大时,样本均值的分布将近似呈正态分布,并且均值等于 mu(y),标准差等于 (sigma(y))/sqrt(n)。 收起阅读 »

十个常用的六西格玛统计工具及应用场景

六西格玛是一种质量改进方法,企业已经使用了几十年 - 因为它取得了成果。六西格玛项目遵循明确定义的一系列步骤,世界各国的每个行业的公司都使用这种方法来解决问题。...
六西格玛是一种质量改进方法,企业已经使用了几十年 - 因为它取得了成果。六西格玛项目遵循明确定义的一系列步骤,世界各国的每个行业的公司都使用这种方法来解决问题。

但是,六西格玛在很大程度上依赖于统计和数据分析,许多对质量改进不熟悉的人感到受到统计方面的威胁。你不必被吓倒。虽然数据分析确实对提高质量至关重要,但六西格玛的大多数分析并不难理解,即使您对统计数据不是很了解。但使用Minitab熟悉这些工具是一个很好的起点。本文简要介绍六西格玛中常用的10种统计工具,了解它们的作用以及它们为何如此重要。

1.帕累托图(Pareto图)

图片1.png


帕累托图来源于一种称为帕累托原则的观点,该观点认为大约80%的结果来自20%的原因。即使在我们的个人生活中,也很容易想到例子。例如,80%的时间你会穿买的衣服中20%的衣服,或者你在图书馆80%的时间只会听网易云音乐中收集的20%的音乐。

帕累托图可帮助您直观地了解此原则如何应用于您收集的数据。它是一种特殊类型的条形图,旨在将“少数几个”原因与“琐碎的”原因区分开来,使您能够专注于最重要的问题。例如,如果每次出现缺陷类型时就收集有关缺陷类型的数据,则帕累托图会显示哪些类型最常见,因此您可以集中精力解决最紧迫的问题。 

2.直方图

图片2.png


直方图是连续数据的图形快照。直方图使您能够快速识别数据的中心和范围。它显示了大部分数据落在哪里,以及最小值和最大值。直方图还显示您的数据是否为钟形,可以帮助您找到可能需要进一步调查的异常数据点。

3.Gage R&R

图片3.png


准确的测量至关重要。你想用自己认为不可靠的数据来衡量自己吗?你会继续使用从未显示正确温度的温度计吗?如果您无法准确测量过程,则无法对其进行改进,这时Gage R&R就有了用武之地。此工具可帮助您确定连续型数值测量(如重量,直径和压力),当同一个人反复测量同一部件时,以及当不同的操作者测量相同部件时是否准确和精确。

4.属性一致性分析

图片4.png


另一个确保您可以信任您的数据的工具是属性一致性分析。Gage R&R评估连续型数据的重复性和再现性,而属性一致性分析评估的是属性数据,例如通过或失败。此工具显示对这些类别进行评级的人是否与已知标准,与其他评估者以及他们自己一致。

5.过程能力分析

图片5.png


几乎每个过程都具有可接受的下限和/或上限。例如,供应商的零件不能太大或太小,等待时间不能超过可接受的阈值,填充重量需要超过规定的最小值。能力分析向您展示您的流程与规范的完美程度,并深入了解如何改善不良流程。经常引用的能力指标包括Cpk,Ppk,Cp,Pp,百万机会缺陷数(DPMO)和西格玛水平(Z值)。

6.t检验

图片6.png


我们使用t检验来比较样本的平均值与目标值或另一个样本的平均值。例如,工艺参数调整后,想确定钢筋抗拉强度均值是否比原来的2000要高。如果您从两家供应商处购买调味糖浆,并想确定各自出货量的平均量是否有差异,您可以使用双样本t检验来比较两家供应商。 

7.方差分析

图片7.png


t检验将平均值与目标进行比较,或者将两个平均值相互比较,而ANOVA(方差分析的缩写)则可以比较两个以上总体的均值。例如,ANOVA可以显示3个班次的平均产量是否相等。您还可以使用ANOVA分析多于1个变量的均值。例如,您可以同时比较3班次的均值和2个制造地点的均值。

8.回归分析

图片8.png


回归可帮助您确定输出与一个或多个输入因子之间是否存在关联。例如,您可以使用回归来检查公司的营销支出与其销售收入之间是否存在关联。当存在变量之间的关系时,您可以使用回归方程来描述该关系并预测给定输入值的未来输出值。

9.DOE(实验设计)

图片9.png


回归和ANOVA最常用于已经收集的数据。相比之下,实验设计(DOE)为您提供了一种有效的数据收集策略。它允许您同时更改或调整多个因子,以确定输入和输出之间是否存在关系。收集数据并识别重要输入后,您可以使用DOE确定每个因子的最佳设置。

10.控制图

图片10.png


每个过程都有一些自然的,固有的变化,但稳定(因此可预测)的过程是优质产品和服务的标志。重要的是要知道过程何时超出正常的自然变化,因为它可以指示需要解决的问题。控制图将“特殊原因”变化与可接受的自然变化区分开来。这些图表随时间变化绘制数据并标记失控数据点,因此您可以检测异常变化并在必要时采取措施。控制图还可以帮助您确保在未来持续改进流程。 

小结

六西格玛可以为任何企业带来巨大的利益,但是获得这些收益需要收集和分析数据,以便您了解改进的机会并做出重大和可持续的变革。六西格玛项目的成功往往取决于在许多领域都是高技能专家的从业者,而不是统计数据。但是,通过对最常用的六西格玛统计数据和易于使用的统计软件(如Minitab)的基本了解,您可以处理与提高质量相关的统计任务,并自信地分析您的数据。 收起阅读 »

探索未知.预测未来------利用机器学习(CART)预测合格率

80504 人类一直试图让机器具有智能,也就是人工智能(Artificial Intelligence)。从上世纪50年代,...
1.png


人类一直试图让机器具有智能,也就是人工智能(Artificial Intelligence)。从上世纪50年代,人工智能的发展经历了“推理期”,通过赋予机器逻辑推理能力使机器获得智能,当时的AI程序能够证明一些著名的数学定理,但由于机器缺乏知识,远不能实现真正的智能。因此,70年代,人工智能的发展进入“知识期”,即将人类的知识总结出来教给机器,使机器获得智能。 无论是“推理期”还是“知识期”,机器都是按照人类设定的规则和总结的知识运作,永远无法超越其创造者,其次人力成本太高。于是,一些学者就想到,如果机器能够自我学习问题不就迎刃而解了吗!机器学习(Machine Learning)方法应运而生,人工智能进入“机器学习时期”。机器学习的核心是“使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测”。机器学习最大的突破是2006年的深度学习。深度学习是一类机器学习,目的是模仿人脑的思维过程,经常用于图像和语音识别。深度学习的出现导致了我们今天使用的(可能是理所当然的)许多技术。当你问你的iPhone关于今天的天气时,你的话语会用一种复杂的语音解析算法进行分析。如果没有深度学习,这一切都是不可能的。

机器学习与统计区别

3.png


4.png


机器学习是一类算法的总称,这些算法企图从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类,更具体的说,机器学习可以看作是寻找一个函数,输入是样本数据,输出是期望的结果,只是这个函数过于复杂,以至于不太方便形式化表达。
通常学习一个好的函数,分为以下三步: 
1、选择一个合适的模型,这通常需要依据实际问题而定,针对不同的问题和任务需要选取恰当的模型。 
2、判断一个函数的好坏,这需要确定一个衡量标准,如回归问题一般采用欧式距离,分类问题一般采用交叉验证函数。 
3、找出“最好”的函数,如何从众多函数中最快的找出“最好”的那一个,学习得到“最好”的函数后,需要在新样本上进行测试,只有在新样本上表现很好,才算是一个“好”的函数。
机器学习的核心是“使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测”。这意味着,与其显式地编写程序来执行某些任务,不如教计算机如何开发一个算法来完成任务。有三种主要类型的机器学习:监督学习、非监督学习和强化学习。

5.png


6.png


【案例分享】为了预测过程输出性能,提高客户满意度及产品质量,现从数据库中批量导入了2019年5月份生产报表,检测产品能否满足规格要求及相关生产环境,试分析影响产品质量的相关原因及预测结果。
本例共有9个变量,近5000个测试数据,其数据表如下:

7.png


在Minitab最新发布的版本Minitab19.2020中,除了可以将Python的脚本可以导入Minitab加载分析之外,还增加了机器学习的CART分析法。我们将上述案例用CART分析步骤如下:
1、统计---预测分析---CART分类,将响应和影响因子分别填入对应位置

8.png


2、点击 先验/成本,设置误分类成本

9.png


误分类成本就是判断错误的风险,例如,在医学影像检测中,把健康的人误诊为病人还不是最糟的情况,只要医生能对诊断结果进行复查,并把健康的这个人找出来就可以了。但反过来,未能诊断出真正的病人而不提供给他任何治疗,则就非常危险了。默认情况下,Minitab 使用相等的成本 1。
3、点击 验证,选择验证方法

10.png


设置模型验证:数据通常被分为训练数据和测试数据
训练数据(学习数据)通常被用来创建模型及评估模型的系数;测试数据通常检模型性能,通过测试数据得到拟合值,在用训练数据的数据和对应的拟合值进行比较来检验模型的预测性能通过验证,防止模型过度拟合若用同一组数据来拟合模型并评估模型的拟合优度,会导致过度拟合,过度拟合的模型并不能用于很好的预测…..

11.png


12.png


4、点击 选项,设置节点分裂方式

13.png


默认的节点分裂,选择 基尼

14.png


对所有对话框点击 确定,查看Minitab输出(部分):

15.png


默认情况下,Minitab 为误分类成本在最小误分类成本 1 个标准误内的最小树生成输出。也可以识别最优树的序列中探索其他树。终端节点数越多,模型就越复杂。

16.png


17.png


ROC曲线指受试者工作特征曲线 / 接收器操作特性曲线(receiver operating characteristic curve), 是反映敏感性和特异性连续变量的综合指标,是用构图法揭示敏感性和特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵坐标、(1-特异性)为横坐标绘制成曲线,曲线下面积越大,诊断准确性越高。
点击ROC图左下角的预测,可以根据模型预测不同场景下的输出概率。

18.png


总结:
机器学习是目前业界最为火热的一项技术,从网上的每一次淘宝的购买东西,到自动驾驶汽车技术,以及网络攻击抵御系统等等,都有机器学习的因子在内,同时机器学习也是最有可能使人类完成“AI 梦”的一项技术,各种人工智能目前的应用,如微软小冰聊天机器人,到计算机视觉技术的进步,都有机器学习努力的成分。作为全球领先的统计分析软件,Minitab在2018年收购了SPM,并在Minitab.19.2020版中增加了预测分析的CART分类和CART回归功能,能够帮助我们了解一些机器学习的相关知识与概念,更好的理解为我们带来莫大便利技术的背后原理,以及让我们更好的理解当代科技的进程。 收起阅读 »

田口设计案例-晶体外延层生长实验

案例背景 生产集成电路(IC)器件的一个初始步骤是在抛光的硅晶片上产生一个外延层,镶在一个称为感应器的六面柱体上(每面有两块晶片),这个六面柱体在...
案例背景
生产集成电路(IC)器件的一个初始步骤是在抛光的硅晶片上产生一个外延层,镶在一个称为感应器的六面柱体上(每面有两块晶片),这个六面柱体在一个钟形容器里旋转,这个容器通过其顶部的喷咀喷入化学蒸汽并加热。这个过程持续到外延层生长到所要求的厚度,厚度的目标值14.5微米(um),其误差范围为14.5土0.5微米,即实际的厚度应该尽可能接近14.5,并在区间[14,15]内。当前的设置造成的偏差超过了指定的1.0微米,于是试验人员需要找出可以设置的过程因子使得外延层的不均匀性达到最小,同时确保平均厚度尽可能接近目标值。

稳健参数设计
响应变差可以通过减小噪声变差来减小,但这可能要付出高的经济代价。由Genichi Taguchi最先提出的稳健参数设计(robust parameter design)是一种可选择的策略,该策略是通过探索控制因子与噪声因子间的交互效应来改变控制因子的水平组合来减小响应变差。因为控制因子通常很易于改变,所以稳健参数设计比直接减小噪声变差更经济更方便。

外延层生长试验的因子和水平
原始外延层生长试验的试验因子如下表所示,共有八个控制因子(A-H)和两个噪声因子(L和M)。

图片1.png


每个感受器有四个面,因此因子M有四水平。在每一个面上位置幽分顶部和底部(因子L)。在最初的试验中, Kackar and Shoemaber (1986)报告六个面的结果.为了方便说明,这里我们只考虑四个面。因为所期望的是在任何面和位置上都有均匀的厚度,所以因子L和M都处理为噪声因子。

图片2.png


厚度的目标值是14.5微米,规定误差限制在14.5士0.5微米。这样,试验的目标就是在保持14.5微米的平均厚度的同时,最小化外延层在四个面以及顶、底部上厚度的不均匀性。

乘积表分析
此田口设计的内表采用L16 (2^8)的正交表(表示设计有16个实验和8个因子,以及 每个因子2个水平)。外表对两个噪声因子选用了2x4设计,这样每个控制因子水平组合就有8个观测值。那么,按照乘积表分析的话就有16x8=128次实验。

图片3.png


Minitab中田口分析

图片4.png


图片5.png


望目特征问题的两步程序:
选择散度因子的水平使散度最小化(信噪比最大化)
选择调节因子的水平使位置达到目标值

图片6.png


图片7.png


要想第一步中信噪比最大化,则应该取因子组合为:
A1B1C1D1E2F2G2H2
基于以上最佳信噪比组合,预测均值是否达到目标值14.5微米。

图片8.png


图片9.png


图片10.png


由以上预测结果可知,均值没有达到14.5微米,需要进行调节。
从下面的均值主效应图中可以发现,砷流比率(%)是一个合适的调节因子。

图片11.png


图片12.png


为此,我们固定A1B1C1D1F2G2H2,改变E的水平进行预测,结果如下:

图片13.png


图片14.png


根据预测的结果,我们下一步将会固定A1B1C1D1F2G2H2,因子E砷流比率(%)在(55,59)范围内选取,再次进行新的实验。

思考
在本案例中为了实现稳健参数设计,我们用的是田口设计中的乘积表,但乘积表实验次数太多了(128次),有没有其他方法也可以实现稳健参数设计呢?另外,乘积表分析除了实验次数多以外,还有没有其他一些缺点呢? 收起阅读 »

过程能力分析04—非正态(非参数方法)

通过此系列文章,目前我们学习了过程能力分析的意义,基于Minitab的正态/非正态数据过程能力分析的思路和方法,其中在非正态数据能力分析中,我们讲了两种方法——...
通过此系列文章,目前我们学习了过程能力分析的意义,基于Minitab的正态/非正态数据过程能力分析的思路和方法,其中在非正态数据能力分析中,我们讲了两种方法——转换方法和拟合其他分布方法。文章发布后,果不其然大家又有了新的问题,我们今天先来回答一些问题,再来介绍非正态数据能力分析的另外一种方法——非参数方法。
你有这些疑问吗?

基于前面文章的说明,我们反复强调过程能力分析的一些前提条件(计算Cp/Cpk要求数据满足“独立、正态、MSA合格、稳定”,计算Pp/Ppk只要求数据满足“MSA合格,独立”)。我们还说过,以下公式只适用于正态分布数据。

图片1.png


图片2.png


那么,你有跟下面这位朋友一样的疑问吗?

图片3.png


对于这个问题,首先我们要知道,不管是正态数据还是非正态数据都可以计算Ppk,但是拟合分布不同计算结果肯定是有差异。如果数据正态可以按照上面的公式计算,如果非正态我们前面文章介绍了两种方法——转换/拟合其他分布。虽然计算Ppk不需要数据正态,但是做为数据分析人员我们要知道到底选择的正态方法还是非正态方法。直白点说,虽然计算Ppk不要求数据正态,但是我们仍然要在做过程能力分析计算Ppk之前执行正态性检验,只有这样你才知道从Minitab的哪个窗口进入分析。

图片4.png


图片5.png


另外一个问题,也是经常被问到(就我而言,就最少被问过不下20次)。

图片6.png


前面文章我们说过,如果数据非正态不要急着转换数据或盲目套其他分布,我们可以先来个“个体分布标识”。但是在“个体分布标识”中我们可能会遇到以下情况——两种变换都不行,14种分布中没有一个能够很好拟合数据。

图片7.png


对于这种情况,我们需要花费更多的精力回到数据搜集的现场做调查,而不是为了得到一个过程能力报告去寻求统计专家的帮助(再高明的专家如果不去现场也只能帮助你猜原因)。

比如像上面的“个体分布标识”输出,为什么找不到合适分布,其实我把数据展示一部分给大家看一下就知道原因了(测量系统分辨力不够或数据经过了修约处理)。

图片8.png


上面的“个体分布标识”是Y2的输出结果,如果我对Y1列执行相同分析呢?

图片9.png


这里我只是展示一种可能找不到合适分布的原因——测量系统分辨力不足,那你的数据又是什么原因导致找不到合格分布呢?这个问题别人无法回答,需要你去现场找答案。那如果我所有怀疑的原因都找了一圈结果还是没有发现问题出在哪里,那可不可以计算过程能力呢?这时候如果你的数据量比较大的话(最好1000以上),我们还有一种方法可以来计算过程能力——非参数方法。这种方法不需要知道拟合分布,但要求样本量比较大。
 
非参数方法

非参数方法计算过程能力的核心逻辑跟前面介绍的拟合其他分布是一样的。

图片10.png


因为找不到合适拟合分布,所以这里的分位数计算就不能用之前的方法了,在这里你可以手算也可以利用 Minitab自带的宏命令来计算这些分位数。

图片11.png


点击“帮助”菜单,我们可以在帮助文档中找到相应的宏命令。

图片12.png


图片13.png


图片14.png


把这个宏命令下载下来,运行之前请阅读仔细阅读帮助中说明,尤其要注意把宏放到指定的位置。 收起阅读 »

过程能力分析03—非正态(拟合其他分布法)

对于过程能力分析,通过之前的文章我们知道在计算能力指标之前需要确认一些前提条件是否满足要求(独立,正态,MSA合格,稳定),今天我们继续延续之前的话题来讨论非正...
对于过程能力分析,通过之前的文章我们知道在计算能力指标之前需要确认一些前提条件是否满足要求(独立,正态,MSA合格,稳定),今天我们继续延续之前的话题来讨论非正态数据如何做过程能力分析。

非正态解决方案
如果您使用为正态数据设计的能力分析,您的数据必须服从正态分布。

图片1.png


图片2.png


对于上面的这些公式,我相信很多朋友比较熟悉(不同教材在公式写法和叫法上可能稍微不同),但我们今天讨论的不是这组公式,为什么呢?因为上面这些公式只适用于正态数据,而我们今天想分享的是非正态数据的能力分析。

对于非正态数据,我们可以通过以下方法来获得准确描述生成非正态数据的过程的能力指数。

图片3.png


正如你所看到的,解决方法有很多,当然方法选择不同结果肯定是有差异的,那么问题又来了,哪个方法是比较合适的呢?别急,我们可以先参考以下路径图帮助我们选择。

图片4.png


在上一篇文章中我们分享了变换的方法(Box-Cox变换),在这篇文章中,我们打算找到拟合数据的合适分布(除了正态分布外,Minitab在这里还提供了其他13种分布),采用非正态的方法来计算Ppk(注意,由于是非正态分布,这时候就无法计算Cp/CpK了)。


拟合其他分布法(ISO方法)原理
对于非正态数据,Minitab后台提供两种算法(21版本中,默认算法为“Z值法”)

图片5.png


但是,我们今天要分享的是“ISO方法”,原因很简单,这种算法大家在六西格玛相关课程和教材中其实学过了(先混个脸熟)。

介绍“ISO方法”之前,我们首先来回顾一下能力分析的含义(如下图所示)。

图片6.png


其中,“客户之声”就是客户给定的公差带宽(USL-LSL),关键是怎么得到“过程之声”。
回想一下,如果数据服从正态分布,我们是怎么估计“过程之声”的?用正态分布的均值做为中心位置,用平均值±3标准差来构造一个99.73%的区间来做为“过程之声”的估计。
那如果是非正态数据呢,我们是不是也可以想办法来获得“过程之声”?但是很多非正态数据的分布不像正态分布那样是对称的(如下面的Weibull分布)。

图片7.png


那么这时候怎么获得中心位置和99.73%的区间呢?我们可以借助“ISO算法”通过计算分位数方法来估计“过程之声”。

图片8.png


说明:

11.png

 
表示指定分布的第0.99865个百分位数(太专业了,看不懂?直白一点说,分布选择不同,计算出来的结果不一样,所以我们需要找到合适的分布)。说到这里我相信大家应该理解了为什么在用Minitab做非正态数据能力分析时需要我们先指定分布了。

图片9.png


拟合其他分布法(ISO方法)计算

基于以上分析,我们可以通过以下三步骤来计算非正态数据的过程能力。
找到合适的分布(除正态分布外有13种选择),怎么确定哪种分布拟合的比较好呢?我们可以利用Minitab中的“个体分布标识”功能。
确定好分布后,第二步就是计算出对应分布的三个百分位数:0.5分位数、0.99865分位数和0.00135分位数(我们可以通过“概率分布图”计算这三个百分位数)。
把计算出来的三个百分位数带入“ISO方法”的公式得到Pp和Ppk。

图片10.png

  收起阅读 »

热门作者