文|聚美丽 飘 飘
“世界是一个巨大的草台班子。”
“只有11个人,样本数量不够吧,这抗性不良反应都凑不齐。”
“大品牌也不便宜,宣传的功效试验样本11人也没啥代表性。”
这是几日前,#娇兰卖780的护肤品实验样本只有11人#词条冲上微博热搜时,部分网友发出的感慨。
引争议:娇兰修护功效实验仅11人
经了解,此次争议源自有网友发现,娇兰明星产品、月销达6w+的帝皇蜂姿焕活复原蜜(以下简称“复原蜜”)在天猫旗舰店的详情页显示,该产品实验数据样本只有11人。页面内容称样本数据由10名高加索裔和1名非洲裔组成,数据源自娇兰内部,其为了验证复原蜜有9倍快修护的功效。
此次这一情况引起的争议主要有两点:一是,娇兰复原蜜为高端产品,功效测试样本仅11人,结果的客观性存疑;二是,该款产品在中国市场的销售群体主要为亚裔女性,但功效测试的采样中缺少亚裔,这并不合理。
在小红书上,一条点赞破万笔记《娇兰的数据样本居然只有11人》,评论区就有部分网友提出质疑,“甚至都不找几个亚裔”、“结合上面一条评论,这个团队有一个非洲人”、“这也太草率,上千块的东西,大公司就11人参与实验”、“正规来说要的是有效例30人,而不是参加30人”等。
从公开的产品详情页来看,复原蜜其他功效宣称也公开了实验来源。娇兰官方宣称,复原蜜灵感源自蜜蜂复原带,除9倍快修护复原元气肌外,还能使肌肤充盈,使用6小时后,肌肤水润度增强144%,这一功效验证源自11名20-58岁高加索裔志愿者(7名女性、4名男性)单次在前臂使用复原蜜,6小时后采用仪器测试所得结果。
此外,娇兰还宣称,特殊美容前后使用黄金复原蜜,能够分别显著加乘肌肤光滑度81%、光泽度69%,而这一功效验证数据源自第三方实验,为30名36-60岁的中国女性志愿者每天两次用于面部和颈部,她们分别在刷酸项目前2周使用复原蜜,以及刷酸项目完成一周后再次使用复原蜜4周后,并由皮肤学专家评估同时与安慰剂组对照所得结果。
图源:天猫
由此来看,实际上娇兰复原蜜宣称的加乘肌肤光滑度和光泽度的功效测试数据源自第三方实验室,且取样自30名中国女性志愿者。
此外,国家药监局显示,娇兰复原蜜备案日期为2023年1月11日,备案的功效宣称为修护、 保湿、抗皱和紧致,同时还有宣称量化指标。其中,修护(注:此次受争议的功效测试)、 抗皱功效和宣称量化指标均有来自娇兰内部和第三方机构北京中德化妆品研究所的功效评价,且第三方机构的人体功效评价试验,进行了取样30名36-60岁的中国女性在皮肤科美容项目前后使用产品的实验。
而紧致功效的人体功效评价试验则源自娇兰内部,采样为30名35-60岁女性,包括23名高加索人、2名亚裔、4名中东人和1名西班牙裔。
保湿功效的人体功效评价试验则来自Laboratoire COSDERMA和娇兰内部,其中Laboratoire COSDERMA的试验采样为30名32-60岁高加索裔女性,娇兰试验采样为11名20-58岁高加索人(7名女性、4名男性)。
图源:国家药监局
最新回应:测试科学,合规销售
目前,针对上述争议,娇兰(法国)总公司客服在荔枝新闻的视频中回应称,“我们的实验室数据,包括测试针对的人群都是科学的、可靠的、值得信赖的,但是关于这个文件的话,这个属于公司机密,还有实验室的数据是无法公开透露的。”
那为什么此次受质疑的修护功效评价试验,在国家药监局中,明明备案了第三方测试的结果,且采样了30名中国女性,但详情页还是标注的内部试验内容?
对此,聚美丽向娇兰官方旗舰店咨询,其客服回应说:“在中国销售的产品均符合国家相关标准,请您放心使用。产品检测情况人群及数量可以查看产品介绍。目前相关检查数据因为内部数据,暂无相关信息。”
图源:天猫旗舰店
那么,目前外资化妆品在国内销售时,公布人体功效测试的数据情况是如何的呢?
从详情页来看,娇兰另一款售价50ml达4100元的御廷兰花卓能焕活修护面霜,其数据样本有来自第三方实验室,取样分别有31名、33名28-66岁高加索裔女性。
图源:娇兰天猫旗舰店
作为对比,宝洁旗下SK-II护肤精华露(即神仙水)的天猫旗舰店详情页显示,其功效实验数据则源自宝洁基于10万余名(年龄介于18-88岁的亚洲女性)的真实数据,在使用SK-Il护肤精华露,肌因光蕴环采钻白精华露和赋能焕采精华霜一周后,经机器测试显示,细滑度/光泽度/紧致度/抗皱度多维度得到提升。
图源:SK-II天猫旗舰店
此外,雅诗兰黛明星产品小棕瓶眼霜的详情页显示,人体功效测试数据源自其第三方实验室,受试者分别为62名、46名40+亚洲女性。
图源:雅诗兰黛天猫旗舰店
讨论:功效测试取样多少合理?
那么,在一众争议之中,最为主要的问题就是,化妆品人体功效测试到底怎样才合理,取样多少才有效、科学?
浙江华睿生物技术有限公司日化事业部总经理蒋丽刚告诉聚美丽,“按国内法规,特殊化妆品的人体功效测试是有明确测试方法的,比如美白、防晒、防脱等,有明确的人员数量规定,不同方法需要的受试人员数量不等(如SPF指数,最小测试人数为10,最大测试人数是20);美白不低于30人,防脱不低于60人(需要分实验组和对照组),其它的功效目前国家没有规定测试方法,但有一些团标是能够参考采纳的,但按照《化妆品功效宣称验证指导原则》 ,方法未要求时,有效受试人数应当具有统计学意义。”
“从统计学要求来说,通常需要有30个及以上的有效案例。且这个有效案例指的是全程做完测试且结果有效的人数。因为如果人数太少,不能够达到统计的需求,也就不能够证明结论的可靠性。”蒋丽刚如是说道。
图源:截自《化妆品功效宣称评价规范》
而另一位成分研究出身的品牌创始人李辰则表示,此次争议实际上是国内外法规监管有区别,欧洲是企业负责制,欧盟没有明确规定,中国有明确规定化妆品的功效宣称需要进行人体功效评价试验。
“但从统计学意义来说,结果至少要来自33个以上的有效数据,因此从中国法规的角度及统计学意义上来看,该结果对产品功效的支持偏弱。”李辰向聚美丽透露。
巢归研究院科学传播负责人、知乎美妆科普主笔芒奇金介绍道:“在我国化妆品按照风险程度进行分类管理,具有祛斑美白、防晒、防脱发、祛痘、滋养和修护功效的化妆品需要进行人体功效测试,而其他功效宣称的护肤品则可以在人体功效试验,消费者使用测试,实验室试验,文献资料或研究数据中按照规范要求进行选择宣称支持方式。”
芒奇金补充道:“相比药品的人体临床试验比如双盲多中心临床,化妆品的人体功效评价会简单很多,但是特殊化妆品如美白/防脱类人体功效评价则有明确的规范要求,所以招募受试者的时候会多招募一些,确保最终有效例数不低于30人而且会有不同时间间隔的测试数据。对于其他功效宣称的普通化妆品,目前没有明确方法的情况下,按照《功效宣称评价规范》,有效人数应当具有统计学意义,一般认为30个数据是具备统计学计算的一个基本门槛。”
图源:截自《化妆品祛斑美白功效测试方法》
在此之下,聚美丽也就上文内容中的一点提出了疑问,为什么此次娇兰修护功效,实际上国家药监局备案显示,有来自两方的数据,一方是娇兰内部,另一方则是第三方机构北京中德联合研究所做的人体功效试验(受试者采样30名中国女性),但详情页只标注了其中娇兰内部数据。
图源:国家药监局
对此,李辰认为,这属于操作层面的失误,可能是像娇兰这样的大公司,市场部本身离临床、备案太远,加之内部沟通、协调不顺,或者说是备案过程中也有一些第三方数据,但是他们并没有采纳。
芒奇金则认为,网友的声音主要还是在于,对公司内部的实验数据科学性的质疑。因此,他建议:“品牌在做功效宣称的时候,除了自己实验室数据,需要在目标市场找第三方机构做评估测试,测试的结果需要有统计学意义,这样在和消费者、KOL沟通时会比较有说服力。”
那么,娇兰详情页公布的11人内部数据是否有问题呢?
荃智美肤生物科技研究院研发总监张太军指出,娇兰诚实公布样本量没有什么大毛病,可靠性交给社会来评判。
“一般少于30个就会被质疑,但是娇兰并没有把11个人虚构成30个人,这方面没有办法去指责它。而且小样本量的数据一致性很强,它也不一定代表样本放大之后就会和大样量数据一样。总归来说,严格按照统计学方法来做,就代表没有隐瞒真相和没有主观宣称。”
蒋丽刚也认为,娇兰的样本数据很诚实,如果实验量缺乏则可以加强弥补。
从上述内容来看,实际上此次娇兰引起的争议,正是表明当下随着化妆品新规的逐渐落地,消费者对产品的安全性、科学性的要求也在提升。
不过,在2021年5月1日,国家药监局颁布的《化妆品功效宣称评价规范》中,规定化妆品上市前必须通过功效评价,但没有硬性要求样本数量。
如今,在化妆品功效宣称监管体系的搭建上,才经历到第4个年头,还有很多方面需要完善,由此辩证来看,消费者的质疑也是在促进着法律、法规的完善。
正如,张太军所言,“目前国内关于化妆品功效验证的工作展开时间不是很长,还处于探索阶段。但是从实际上,从全世界的范围来说,也没有说国外就比我们成熟的很多。因此,很多时候还是在探索之中建立模型,包括方法、标准等。”
注:应采访者要求,李辰为化名。
评论