
Սինթետիկ տվյալը (synthetic data) տվյալ է, որը ստեղծվել է արհեստական ձևով՝ մաթեմատիկական մոդելների, ալգորիթմների և սիմուլյացիաների միջոցով, այլ ոչ թե ուղղակի հավաքագրվել իրական աշխարհից։
Օրինակ՝ եթե մենք ունենք հիվանդների իրական տվյալների բազա, ապա սինթետիկ տվյալը կարող է նկարագրել նմանատիպ, բայց ոչ միանշանակ իրական պացիենտ՝ ստեղծելով "հինման պատճեն", առանց որևէ իրական մարդու տվյալների խախտման։
Բժշկական տվյալները չափազանց զգայուն են։ Դրանք պարունակում են անձնական առողջական տեղեկություններ, որոնց արտահոսքը լուրջ իրավական և բարոյական հետևանքներ ունի։ Բայց միևնույն ժամանակ, AI մոդելները (օրինակ՝ քաղցկեղի ախտորոշման համար) պահանջում են մեծ քանակությամբ տվյալ՝ վարժվելու համար։
Այստեղ է հայտնվում սինթետիկ տվյալը՝ որպես լուծում․
Սինթետիկ տվյալները լավ տարբերակ են, բայց դրանք կարող են սխալներով լի լինել, եթե ստեղծման ալգորիթմը հուսալի չէ։ Կարող են լինել նաև սխալ ախտորոշման ռիսկեր, եթե տվյալները չափազանց "արհեստական" են։
Սինթետիկ տվյալները դառնում են կարեւոր գործիք առողջապահության մեջ՝ հարմարեցնելով նոր տեխնոլոգիաները՝ առանց խախտելու տվյալների պաշտպանությունը։ Այո, դրանք իրական չեն, բայց ծառայությունն իրական է՝ ավելի լավ ու անվտանգ առողջապահական համակարգ։