Aprendizagem De Máquina Em Ação. Alan T. Norman
Чтение книги онлайн.
Читать онлайн книгу Aprendizagem De Máquina Em Ação - Alan T. Norman страница 3
Está claro que a aprendizagem de máquina ainda não é adequada ao raciocínio simbólico de alto nível. Por exemplo, um algoritmo pode ser capaz de identificar uma cesta, ovos coloridos e um campo, mas não seria possível dizer que é uma caça aos ovos de Páscoa, como a maioria dos seres humanos faria.
Normalmente, os projetos de aprendizagem de máquina têm um problema específico muito restrito, para o qual estão a encontrar uma resposta. Um problema diferente exigirá uma nova abordagem e possivelmente um algoritmo diferente.
A aprendizagem de máquina é possível em escala devido à quantidade de dados que começamos a coletar nos últimos anos. Essa revolução do big data é a chave que desbloqueou o treino complexo com algoritmos. Os dados estão no centro do ajuste de um algoritmo de aprendizagem de máquina para dar a resposta certa.
Como os dados são tão centrais para a aprendizagem de máquina, os resultados são um reflexo direto das entradas. Se houver uma tendência nos dados, o algoritmo de aprendizagem de máquina aprenderá a ser tendencioso. Por exemplo, preditores de contratação de candidatos, recomendações de sentenças judiciais e diagnóstico médico estão todos a usar a aprendizagem de máquina e todos eles têm algum nível de tendência cultural, de genero, raça, educação ou outra tendência incorporada aos datasets que os treinam.
A tendência vai além do preconceito na coleta de dados. Às vezes, os dados enganam um algoritmo de outras maneiras. Considere o caso de um modelo militar de aprendizagem de máquina treinado para procurar tanques camuflados numa floresta. Os cientistas de dados treinaram o algoritmo num conjunto de fotos, algumas das quais com tanques nas árvores e outras com apenas árvores. Após o treino, o modelo obteve precisão quase perfeita nos testes realizados pelos cientistas de dados. No entanto, quando o modelo entrou em produção, não funcionou para identificar os tanques. Acontece que no conjunto de dados de treino, as fotos dos tanques foram tiradas num dia ensolarado, enquanto as fotos somente da floresta foram tiradas num dia nublado. O algoritmo aprendeu a identificar dias ensolarados vs. dias nublados, não tanques!
Конец ознакомительного фрагмента.
Текст предоставлен ООО «ЛитРес».
Прочитайте эту книгу целиком, купив полную легальную версию на ЛитРес.
Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.