刘保延：打造中西医学疗效评价“公平秤”

作者：刘保延来源：中国中医药报点击：1896次更新：2020-12-30

　　•既往评价干预措施本身疗效的方法，由于扭曲了辨证论治，并不能客观地反映辨证论治的能力和水平。

　　•疗效评价是不同医学间统一的度量衡系统，应该是一杆“公平秤”。根据中医临床特点完善此“公平秤”，是疗效评价的首要任务。

　　•借鉴体育竞赛的理念和方法，利用真实世界的数据，以评价主导辨证论治的医者及其代表队的疗效，将能直接促进辨证论治的方案优化，提升疗效。

　　刘保延，中国中医科学院首席研究员、主任医师、博士生导师、国际欧亚科学院院士；国家中医药管理局中医临床评价方法重点研究室主任。世界针灸学会联合会主席、中国针灸学会会长、世界卫生组织传统医学顾问，《中国针灸》主编等。主要研究方向是中医、针灸临床疗效评价方法学研究。主持国家973计划、863计划、科技攻关计划、自然科学基金等项目20多项，致力于将中医临床特点与临床流行病学、循证医学以及真实世界临床研究、大数据、互联网的理念方法相结合，提出“真实世界中医临床科研范式”和辨证论治疗效评价以评价“医者”疗效为先导的创新思路和方法。组织研发的“中医临床科研信息共享系统”已经在国家中医临床研究基地等几十所医疗机构得到推广应用；组织构建了“针灸临床评价体系”，开展了10多项针灸临床研究。

　　辨证论治是中医诊疗疾病的主体方法，个体化诊疗是其突出的特点，但辨证论治个体化诊疗的疗效评价问题，长期以来制约着中医药的发展。大量的研究显示，如果照搬现代临床流行病学的方法，固定了干预，针对“标准证候”进行评价，往往失去了辨证论治个体化诊疗特点，疗效自然而然也很难得到真实客观的展示，如何在保持辨证论治不被扭曲的状况下，对其诊疗效果进行评价就成为一个瓶颈，也是中医“传承精华，守正创新”必须解决的首要问题之一。

辨证论治的

临床效果及其评价

　　辨证论治是遵循中医学发展规律、实现 “天人合德”理念的原创诊疗方法，距今已有近两千年的历史，目前仍然是中医诊疗疾病的主体方法。辨证论治过程中，每一次复诊均会通过望、闻、问、切四诊合参对上次治疗的效果做出判断，以此作为 “效不更方”或 “无效更方” 的重要依据，但这种对效果的评判始终只是停留在医者本人针对患者个体的层面。直到20世纪八九十年代临床流行病学、循证医学被相继引入我国以后，中医、中西医结合的有识之士开始借鉴现代临床评价思路和方法进行了大量的尝试，但符合辨证论治特点的评价方法尚未形成，辨证论治疗效缺乏高质量证据的问题仍在长期制约着中医优势特色的发挥。辨证论治临床疗效评价，是指用科学合理的方法，对医者辨证论治患者群体的效果做出客观、量化的评价，目的是为医者思路的调整、方案的优化与改进，以及疗效的提升提供支撑，同时也为辨证论治推广应用提供高质量的临床证据。辨证论治大致可分为个体化干预（使用饮片、汤剂）与专病专方干预（协定处方、院内制剂、中成药等）两种形式。中医个体化干预是临床使用的主要方法，表现为同一医者根据同一患者不同诊次的临床表现与证候演变而调整方案，进行有针对性的治疗；也可以是不同医生对同一疾病患者辨证论治，采用各自不同的诊疗方案。个体化干预是辨证论治突出的特色优势，也是中医需要坚守的发展方向。 “专病专方”形式是在辨证论治过程中，随着经验积累和提炼，所形成的针对某种疾病、某一症状等较稳定患病群体的相对 “固定干预”。实践证明，“专病专方”是个体化干预的重要补充，但代替不了个体化干预形式。辨证论治临床评价瓶颈主要是指对个体化干预的评价。

　　固定干预的评价方法不适合辨证论治个体化诊疗特点。临床流行病学的临床医学科研设计、衡量、评价（DME）方法，是将流行病学与统计学相结合，从群体的层面，采用量化的科学方法对临床疾病进行研究的现代临床研究方法学，是公认的创造临床最佳研究成果的有力工具。其对干预类研究均是针对固定干预，选定标准的患病群体，通过对照与临床结局治疗前后的变化，来评判干预的疗效，在评价过程中为了避免系统性偏倚，要将医者等人为干扰因素消除到最小，以便评价结果能够真实、可靠地反映干预本身的效果。ＤＭＥ方法被引入我国以后，1982年我国出现了首个针对证候方药的随机对照试验，开启了采用DME方法开展辨证论治疗效评价的先河。几十年来，有关中医临床试验的报告已有几千篇，基本采用的是 “固定干预”针对 “标准证候”的疗效评价思路与方法。如根据疾病统一的病机选定一个固定方药，针对一个规范、标准证候进行干预，临证时再适当随症加减，对其进行疗效评价；或根据疾病的标准证型选定相应的固定方药，分层分组进行疗效评价，这些方法由于缺乏公认且难以把握的“标准证候”，以及“固定干预”扭曲了个体化的特点，而且研究质量难以保证等问题，尚未成为被广泛接受的评价方法。此外，辨证论治前瞻性队列、适应性设计、个体随机对照等思路和方法虽已被提出，考虑了辨证论治个体化的特点，但尚未见有实操性案例的报告。目前大数据时代真实世界临床研究方法已经开始应用于临床评价的实践，遵循规律，解放思想，另辟蹊径，开创辨证论治临床疗效评价的新思路、新策略，选择新方法，走出符合中医特点的发展道路正当其时。

辨证论治的疗效并非单纯

由方药、针灸等干预措施所产生

　　中医学是中国古代科学的产物，以现象层面即事物的自然整体层面为认识的重点，形成了一条独特的认识路线，以静观和意象方法获得了关于天地万物自然整体状态的规律，并按照这样的规律实践，建立了人与人、人与万物共存、共荣、共享的体系。辨证论治正是这一体系的具体体现，其包括辨证、论治与反馈调整三个阶段。辨证是医者在中医理论指导下，通过望、闻、问、切获取患者临床表现，并经四诊合参，在对中医病因、病位、病机和病势等分析理解的基础上，做出疾病证候诊断的过程；论治是医者根据辨证结果，结合自己的临床经验，形成治则治法和治疗方案的过程；反馈调整则是根据患者治疗后的反映，对诊断、治疗方案进行适当调整，最终达到防治疾病目的的过程。辨证论治是一个医者主导、医患互动，以疗效为导向，证—治—效紧密相关的整体、动态、个体化、复杂的干预过程。从治疗效果看，虽然离不开方药、针灸、按摩等干预措施的作用，但实质是医者将 “干预措施”与患者 “状态”有机结合所产生的综合效果。由于药物有四气五味、升降沉浮、七情和合的区分，穴位有归经、分布等不同，而患者的健康状态又与自然、社会、家庭以及心理环境紧密相关，而不同医生遵照和对中医理论的理解有别，各自的临床经验有异，将 “干预措施”与患者状态匹配的结果因人而异且相差很大。同时在医患交互过程中，不同医者与不同患者交互的模式也不相同，每个医者都有各自的方式，而这些都会对辨证论治的疗效产生影响。可见辨证论治效果体现的是医者驾驭 “干预措施”与医患交互等综合能力和水平。对于这样一种以医者为核心的辨证论治，如果只针对固定干预 “方药”“针灸”等干预措施而单纯评价其作用效果，一则支撑其的“证候标准”难以达到共识，即使制定了“证候标准”但临床实际中也难以应用；二则固定干预并不能客观反映 “人与人”“人与物”共存共荣的效果。这与现代医学疾病对抗模式是不同的。现代医学中干预措施是标准化的简单干预，针对一个标准化诊断的同质人群，评价疗效只需要评价某种干预方法对某种疾病是否有效，在评价中医生、患者人为的、非特异性的因素均是被控制、消除的主要内容。而对于辨证论治个体化诊疗疗效的评价必须从简单范式评价固定干预措施（简单干预）的传统套路中解脱出来，回归到辨证论治的本源和特点，来评价在辨证论治过程中驾驭干预措施的医者—“人”的疗效，为辨证论治疗效的不断提升和优化奠定基础，评价结果推荐的是“医者”，而非一个固定方药。

体育竞赛评价

“人”驾驭“物”效果的启迪

　　体育运动早在人类社会文明的初期就已经出现，是一种特定心身活动形式，已经有数千年的历史。体育运动是人的自然需要和本能冲动，是一种寻求生存平衡、身体强大和生命意义的自然表达，是人类生存和发展的必需，也是最为真实的情感体验。体育比赛是对运动员身体本能、对驾驭器物能力和水平进行评估的过程。比赛中裁判员通过评估的标准（指标）对运动员遵循规定规则所进行运动能力和水平进行评价。要求运动员在比赛过程不仅要遵守运动规则，还要遵从道德规范。体育比赛显示的不是器械本身的作用，而是运动员驾驭器械的能力和水平，是 “人与物”共融的效果。例如，乒乓球比赛中乒乓球是运动场上运动员公用的器物，比赛不是评估乒乓球本身的作用，而是评估运动员个人驾驭乒乓球与运动员群体相互协同实现进球目标的能力和水平。比赛制定了一整套合理、公认的规则和指标体系，有严谨的专业化裁判队伍，有公平公正的流程和管理，以保障比赛的结果真实可靠。比赛的类别是领域类与区域层次类相结合，而运动员或代表队的水平，是由不同层次的比赛记录来体现的。高层次比赛的参加者是通过低层次的比赛而逐级选拔产生，区域的运动水平往往是由代表队的水平来体现。随着大数据、人工智能以及互联网等广泛的应用，体育比赛记录、显示、组织、实施的方式及机制日新月异，但这些现代科技只是让体育运动的特色更加突出，而并没有改变体育运动本身的特点。

　　辨证论治的过程类似于体育运动，医者是运动员，干预措施——方药、针灸等相当于运动员手中的篮球、足球、乒乓球等，尽管干预措施是直观影响治疗效果和预后的主体，但实际效果产生是医者驾驭这些干预措施，以及医患交互的综合作用。可以借鉴体育竞赛以评价运动员驾驭运动器物能力和水平的思路方法，评价医者辨证论治某病的效果而非单纯评价干预措施的作用，评价结果推荐的不是一种固定方药或针灸等外治方法，而是一个或一群治疗某种疾病疗效较优、把握度较高的医者。通过对医者疗效的评价，同时可对医者诊疗的特点、优势分析总结，成为医者间相互学习、以疗效为导向不断提升自我辨证论治能力和水平的原始动力。还可以对医者诊治某种疾病的“专病专方”进行整理挖掘，为更多来源于临床的院内制剂以及中药新药的研发提供支撑。对于中医治疗某类疾病的效果，也可以效仿体育比赛的方法，以经过层层筛选的“代表队”来体现中医不同层次治疗某种疾病的能力和水平，而不是用参与此类疾病治疗的所有医者的平均治疗效果来体现。由于辨证论治是 “证—治—效”紧密相关的过程，蕴含着中医对健康、疾病、养生观等认知以及有效干预措施的思路和途径等丰富的内涵，有显著疗效的“代表队”成员的理念、经验也将成为中医理论完善的源泉和依据，这也是克服目前中医理论与实践脱节、走出 “纸上谈兵”困境最有效的解决办法。

根据中医特点

完善疗效评价“公平秤”

　　疗效评价是不同医学间统一的度量衡系统，应该是一杆 “公平秤”，根据中医临床特点完善此“公平秤”，是疗效评价的首要任务。中医药与现代医学以及其他医学间干预效果的比较，是丰富临床诊疗方法，不断提升临床疗效的驱动器。疗效评价系统是一个跨学科的、统一的“疗效”的度量衡系统，应该是一个“公平秤”。作为一个“公平秤”其度量衡系统是标准、规范的，是适应于不同学科的。如对疾病的诊断标准、疗效评价的标准、数据质量标准等应该是统一的，是学术界公认的。但由于各个学科理论基础不同，对同一事物的认识角度和方法不一样，对构成“公平秤”的器件要求不一样。如“秤盘”的大小、“秤砣”的规格等，各个学科要求不同。目前的此“公平秤”是现代医学根据其临床特点所打造的，在许多“器件”上并不能完全适应“中医药”学的需求，如辨证论治个体化诊疗在现代医学中就没有，需要我们创新思路，来建立相应的“器件”和方法，要根据中医自身的特点来改造、完善临床评价体系，而非给中医单独构建一个评价系统。在临床干预效果评价中，“比较”是基本方法，找到“同质”人群进行抽样分组，也是辨证论治个体化诊疗中首先要解决的问题。根据辨证论治鼻祖张仲景《伤寒论》“某种病脉症并治”的思路和方法，我们可以从疾病入手，采取统一疾病诊断、纳入、排除标准，统一年龄、疾病程度等，来保证在疾病层面患病群体是同质的，并根据研究目的对疗效评价指标和测量方法达到共识进行统一。而对于证候诊断（主要是影响预后的非特异性因素）等理、法、方、药（穴位）等则不制定统一的标准，由医生自己来确定，但要规范、完整、准确地做好诊疗过程数据收集，特别要注意治疗效果数据的规范与跟踪收集。关键是要收集一定时间段中被评价医生治疗此种疾病的“全样本”数据。最终显示的是两种干预（中医是某个医生、现代医学是某个干预药物等）对某种疾病的治疗效果而非效力，这种比较可为中西医优势互补奠定基础。同时我们要采取“先人后药”的辨证论治疗效评价的策略。在对辨证论治个体化诊疗医者疗效评价中，先采用真实世界的临床研究方法，通过比较找出治疗某一疾病比较有明显效果的“人-医者”，其后再对医者有效的干预措施进行深入细致的研究，明确其核心的处方、加减变化的规律以及针对的人群，形成相对固定的方药或方穴与刺灸方法。在此基础上，再采用 “理想世界”的方法，在严格控制条件下开展随机对照研究，来确定固定干预的净效应，“两法并举”走出适合中医特点的临床疗效评价之路。

大数据的理念和方法

将成就个体化诊疗的临床评价

　　用评价“人”来评价辨证论治疗效不只是评价思路的转变，更重要的是一种研究范式的转换，同时也是大数据时代研究者世界观、价值观以及方法论的一场革命性变化。评价具体方药等固定干预净效应的方法，是一种抽样、精确、小数据的方法，是小数据时代简单范式的体现，而评价医者辨证论治的疗效将主要采取全样本、混杂、大数据真实世界临床研究方法，这是一种大数据时代的复杂范式。

　　任何一个临床研究过程都是一个数据产生、收集、融合、存储、管理、分析、利用的过程。在传统临床研究中，由于要将复杂问题简单化，尽量排除研究者、研究环境对研究对象的干扰，根据研究目的，采用结构化的临床观察表，收集研究目的规定的、有限的、与结局密切相关的数据，形成可分析利用的最小数据集，以便用精确的数据判断干预与结局间的因果关系。但辨证论治的临床过程，医生面对的是患者而非受试者，主体与客体、客体与环境不可能分离，每位医者的学术观点、遵从的中医理论以及临床经验等都不可能通过所谓的证候标准来统一，医者对疾病认识的角度不同，对同一疾病抓取的临床表现不尽相同，医生各自的理、法、方、药是自洽的，但医者间则是不同的，所以只能采用真实世界的数据来进行研究。而真实世界的临床数据，是将临床诊疗过程中医患互动的信息、干预后效应信息，进行如实、规范、完整、及时地记录，进而形成可分析利用的数据。对复杂临床数据进行预处理、建立数据仓库、建立临床数据多维检索查询系统、数据挖掘分析平台、知识图谱展示平台等，都是真实世界临床评价研究所必须的。而我们十多年来研发的中医临床科研信息共享系统正是实现以上研究的有力支撑和技术平台。传统的临床干预性研究中对照、随机、重复的原则是保障不同干预组间可比性的基础，对于“人”的评价同样适用。我们可以根据临床具体条件，采用解释性或实用性随机对照、队列研究、病例对照、巢式病例对照研究、伞式研究、蓝式研究等设计，尽可能使评价对象间差异最小化，使医者辨证论治疗效的差异不是来自患者本身的差异，而是医者的干预。

　　辨证论治以医者为评价对象的疗效评价，其数据是临床实践中的真实世界数据，但并不影响不同研究设计的应用，随机对照试验仍然是真实世界临床研究的金标准。对于此类的研究我们已经以原发性失眠等为例，开展了一系列的临床研究，建立分析挖掘新知识的模型和相关平台，积极探索了从评价医者入手，开展的前瞻性队列研究、随机对照研究以及安慰剂对照研究等，初步显示此类研究是可行的，是可以达到评价辨证论治疗效以及发现不同医者诊疗特点、核心处方的目的。对于辨证论治疗效评价中“人”驾驭干预措施能力和水平的评价方法、组织模式、运行机制等，体育竞赛中许多成功的经验是值得我们进一步深入学习、借鉴。

　　辨证论治是中医原创的诊疗方法，尽管其规范用语只有60多年，但此种方法从张仲景开始已经使用了近两千年，目前仍然是临床的主体，也是中医需要坚守的特色优势。既往评价干预措施本身疗效的方法，由于扭曲了辨证论治，并不能客观地反映辨证论治的能力和水平。本文提出借鉴体育竞赛的理念和方法，利用真实世界的数据，以评价主导辨证论治的医者及其代表队的疗效，来反映辨证论治的疗效，将能直接促进辨证论治的方案优化，提升辨证论治的疗效。同时为患者找到合适的医生，让医生去诊疗适宜的患者奠定基础；为专病专方的发现和深入研究提供数据支撑。此外，这一方法也为从临床实践凝练中医理论，丰富和发展中医理论找到具体载体奠定了基础。同时我们认为，从系统论来看，每一位中医医师就是一个独立的子系统，而中医则是由这些子系统组成的一个开放的、复杂巨系统。子系统间处于一种自适应、自组织、自我完善、相互学习、相互竞争的发展过程中，而辨证论治个体化诊疗的临床评价，将会成为中医发展的动力系统，为中医走出符合自身规律的发展之路，奠定坚实基础。尽管我们已经按照此思路和方法做了一些探索性研究，但具体的方法还需要在实践中不断创立和完善。相信随着互联网、人工智能、5G技术等不断完善，随着辨证论治效果评价新方法的建立和应用，以高技术为支撑的辨证论治新热潮必将形成，并突破瓶颈，释放潜能，使中医的优势特色在健康中国建设中发挥出更大作用。

刘保延：打造中西医学疗效评价“公平秤”

新闻中心