Одной актуальных проблем для исследователей в области машинного обучения является уменьшение предвзятости, которая зачастую представлена в исходных данных и может усиливаться такими системами.
Например, если разработчик хочет создать алгоритм, помогающий определять наиболее подходящих кандидатов на вакансию, то он может использовать существующих сотрудников компании в качестве источника данных. В результате ML-система будет иметь соответствующие искажения. Так, если в компании работает больше мужчин, то им может присваиваться больший вес в выборке. При этом люди с определенным опытом или характеристиками могут отсеиваться.