Usuario:Jzh2074/Andrej Karpathy

Andrej Karpathy
Información personal
Nacimiento 23 de octubre de 1986 (37 años)
Bratislava, Eslovaquia
Nacionalidad Eslovaquia, Estados Unidos
Educación
Educación University of Toronto, Columbia University, Stanford University
Educado en Stanford University
Tesis doctoral Connecting Images and Natural Language (2016)
Supervisora doctoral Fei Fei Li
Información profesional
Área Inteligencia Artificial
Empleador Tesla (2017-2022)
Obras notables Autopilot

Andrej Karpathy (nacido el 23 de octubre de 1986[1]​) es uno de los científicos de datos más influyentes e innovadores.[2]​ Es especialista en aprendizaje profundo (deep learning) y visión por computadora (computer vision). [3][4]

Entre 2017 y 2022 fue el director de inteligencia artificial y Autopilot Vision en Tesla. [5][6][7]

Educación editar

Andrej Karpathy nació en Bratislava, Checoslovaquia (ahora Eslovaquia) [8][9][10][11]​ y se mudó con su familia a Toronto cuando tenía 15 años. [2]

Inicialmente estaba interesado en la computación cuántica, pero derivó hacia la inteligencia artificial.

‘Compared to my Quantum Computing escapade, I finally felt that the only thing that stood between me and my goal was entirely my own ingenuity, not some expensive equipment or other externalities. Additionally, I realized that working on AI is arguably the most interesting problem because it's the ultimate meta problem: if I was successful in my quest, the AI could in principle learn all about anything, with Quantum Mechanics merely as a relatively insignificant special case.‘
‘Comparado con mi escapada de la computación cuántica, finalmente comprendí que la única cosa que se interponía para conseguir mi objetivo era mi propia inteligencia, no unos aparatos carísimos y otras externalidades. Además me di cuenta que trabajar en inteligencia artificial es el problema más interesante porque es último meta-problema: si tenía éxito en mi búsqueda, la inteligencia artificial podría aprender cualquier cosa, mientras que la computación cuántica es relativamente un caso especial insignificante.’
Andrej Karpathy

[2]

Se licenció en Ciencias de la Computación y Física (Computer Science and Physics) en la Universidad de Toronto en 2009 [12]​ y completó su maestría en la Universidad de Columbia Británica en 2011, [12]​ donde trabajó en animación de figuras simuladas físicamente.

Estuvo de becario dos períodos en Google Research trabajando en redes neuronales (Google Brain) para la clasificación de video en 2013[2]​, y en 2015 con DeepMind con el equipo de aprendizaje profundo con refuerzo.

Junto a Adam Coates publicó una publicación (paper) NIPS para entrenar un modelo de aprendizaje profundo sin supervisión (unsupervised deep learning model) con millones de imágenes de YouTube y descubrir automáticamente conceptos visuales recurrentes.[2]

Desarrolló la librería ConvNetJS en JavaScript de aprendizaje profundo con redes neuronales para usarla en un navegador (web browser). Permite realizar demos que entrenan redes neuronales convolucionales dentro del navegador.[2]

Se graduó con un doctorado de la Universidad de Stanford en 2015 bajo la supervisión de Fei-Fei Li, centrándose su tesis doctoral en la intersección del procesamiento del lenguaje natural y la visión artificial, y en los modelos de aprendizaje profundo adecuados para esta tarea (Connecting Images and Natural Language). [13][14]

Durante el primer año del programa de rotaciones trabajó con Daphne Koller, Andrew Ng, Sebastian Thrun y Vladlen Koltun.[15]

Carrera editar

A finales de 2015 Elon Musk y otros crearon OpenAI, una compañía de investigación de inteligencia artificial (IA) sin fines de lucro que tiene como objetivo promover y desarrollar inteligencia artificial amigable de tal manera que beneficie a la humanidad en su conjunto. La organización tiene como objetivo "colaborar libremente" con otras instituciones e investigadores al hacer sus patentes e investigaciones abiertas al público. Los fundadores (notablemente Elon Musk y Sam Altman) estaban motivados en parte por las preocupaciones sobre el riesgo existencial de la inteligencia artificial general.

Andrej Karpathy se unió al grupo de inteligencia artificial OpenAI como científico investigador y miembro fundador en septiembre de 2016 [16]

Karpathy publicó media docena de publicaciones (papers) con el director del laboratorio de visión computerizada de Stanford, Fei-Fei Li, que posteriormente fue jefe del equipo de aprendizaje automatizado (machine learning) de Google Cloud.

También publicó dos publicaciones (papers) con el que fue director de Inteligencia Artificial de Google, Andrew Ng.

Las investigaciones de Karpathy se centran en el reconocimiento de imágenes y en la comprensión.

Diseñó e impartió la primera clase sobre aprendizaje profundo en la Universidad de Stanford (CS 231n: Convolutional Neural Networks for Visual Recognition). La clase se convirtió en una de las más grandes en Stanford con 150 apuntados en 2015, 330 estudiantes en 2016 y 750 estudiantes en 2017.

En junio de 2017 fue contratado como director de inteligencia artificial de Tesla, reportando directamente a Elon Musk. [4]

En Tesla lideró el equipo de visión computerizada de Tesla Autopilot para el etiquetado de imágenes, el entrenamiento de redes neuronales y la integración para que funcionara en el chip de inferencias fabricado a medida por Tesla. Autopilot mejoró la seguridad y la comodidad de la conducción. El objetivo era alcanzar la conducción autónoma total con Autopilot FSD.[15]

Su equipo fue responsable de desactivar el radar y basar el Autopilot puramente en visión. Karpathy argumentó que la aproximación basada en visión era superior porque se puede escalar mucho mejor. Puede funcionar en una amplia variedad de entornos y no solo en los que han sido mapeados en alta definición. Karpathy se preguntaba: Cuando el radar y la visión disienten, ¿a quién hacemos caso? La visión tiene mucha más precisión, de modo que es mejor apostar por la visión que hacer una fusión de sensores. Karpathy explicó que las ocho cámaras de un Tesla proporcionaban más información sobre el entorno del vehículo que cualquier otro tipo de sensor. Y al contrario de lo que la gente piensa, esto se extiende a la profundidad y a la velocidad de los objetos. Los radares proporcionan muy buena información de profundidad y velocidad, pero pueden tener problemas con las alcantarillas y las sombras creadas por los puentes, porque tiene una resolución vertical mediocre, y proporcionar lecturas falsas. Karpathy explicó que entrenando redes neuronales con conjuntos de datos enormes, limpios y diversos podían proporcionar mejor calidad que el radar en esas métricas. La enorme flota de vehículos Tesla proporcionaba esos conjuntos de datos. Cuando el Autopilot está activado también funciona un programa en la sombra que hace comparaciones entre lo que ve y lo que Autopilot ve.[17]

En marzo de 2022 se tomó un año sabático de Tesla, pero en julio de 2022 Karpathy anunció que dejaría la empresa definitivamente. [18]

Divulgación editar

Karpathy fue nombrado uno de los innovadores menores de 35 años de MIT Technology Review (MIT Technology Review's Innovators Under 35) para el año 2020. [19]

Escribió las aplicaciones arxiv-sanity y arxiv-sanity-lite y creó el sitio web que permite realizar búsquedas por similitud, tiempo y obtener recomendaciones de publicaciones científicas en ArXiv.[15][14]

Escribió el programa de código abierto ulogme! para medir la productividad de forma privada sin tener que enviar datos a sitios web o a la nube.[15]

Siendo un gran aficionado al cubo de Rubik desarrolló el programa «Rubik's cube color extractor» que permite leer y asignar los colores de los cuadrados de un cubo de Rubik mostrando cada cara del cubo a una cámara. La lectura de las seis caras se efectúa en menos de tres segundos.[20]

Hacia 2009 programó en Python una inteligencia artificial para jugar al Tetris en una rejilla de 10x20, consiguiendo superar siempre 1000 líneas y llegando a un máximo de 5000 líneas.[21]

Publica aportaciones en sus blogs sobre sus investigaciones y trabajos en inteligencia artificial.[15]

Es muy partidario de la publicación del código abierto y de impartir charlas de divulgación.[14]

Publicó una guía de supervivencia para hacer una tesis doctoral.[14]

Publicaciones editar

  • World of Bits: An Open-Domain Platform for Web-Based Agents
ICML 2017
Tianlin (Tim) Shi, Andrej Karpathy, Linxi (Jim) Fan, Jonathan Hernandez, Percy Liang
  • PixelCNN++: A PixelCNN Implementation with Discretized Logistic Mixture Likelihood and Other Modifications
ICLR 2017
Tim Salimans, Andrej Karpathy, Xi Chen, Diederik P. Kingma, and Yaroslav Bulatov
  • Connecting Images and Natural Language (PhD thesis)
2016
Andrej Karpathy
  • DenseCap: Fully Convolutional Localization Networks for Dense Captioning
CVPR 2016 (Oral)
Justin Johnson, Andrej Karpathy, Li Fei-Fei
  • Visualizing and Understanding Recurrent Networks
ICLR 2016 Workshop
Andrej Karpathy, Justin Johnson, Li Fei-Fei
  • Deep Visual-Semantic Alignments for Generating Image Descriptions
CVPR 2015 (Oral)
Andrej Karpathy, Li Fei-Fei
  • ImageNet Large Scale Visual Recognition Challenge
IJCV 2015
Olga Russakovsky, Jia Deng, Hao Su, Jonathan Krause, Sanjeev Satheesh, Sean Ma, Zhiheng Huang, Andrej Karpathy, Aditya Khosla, Michael Bernstein, Alexander C. Berg, Li Fei-Fei
  • Deep Fragment Embeddings for Bidirectional Image-Sentence Mapping
NIPS 2014
Andrej Karpathy, Armand Joulin, Li Fei-Fei
  • Large-Scale Video Classification with Convolutional Neural Networks
CVPR 2014 (Oral)
Andrej Karpathy, George Toderici, Sanketh Shetty, Thomas Leung, Rahul Sukthankar, Li Fei-Fei
  • Grounded Compositional Semantics for Finding and Describing Images with Sentences
TACL 2013
Richard Socher, Andrej Karpathy, Quoc V. Le, Christopher D. Manning, Andrew Y. Ng
  • Object Discovery in 3D scenes via Shape Analysis
ICRA 2013
Andrej Karpathy, Stephen Miller, Li Fei-Fei
  • Emergence of Object-Selective Features in Unsupervised Feature Learning
NIPS 2012
Adam Coates, Andrej Karpathy, Andrew Ng
  • Curriculum Learning for Motor Skills
AI 2012
Andrej Karpathy, Michiel van de Panne
  • Locomotion Skills for Simulated Quadrupeds
SIGGRAPH 2011
Stelian Coros, Andrej Karpathy, Benjamin Jones, Lionel Reveret, Michiel van de Panne

Referencias editar

  1. [1]
  2. a b c d e f «Next Generation Machine Learning - Training Deep Learning Models in a Browser: Andrej Karpathy Interview | DataScienceWeekly.org» (en inglés estadounidense). Consultado el 12 de noviembre de 2018. 
  3. «The Guy Who Taught AI to 'Remember' Is Launching a Startup». 28 July 2018. Consultado el 9 August 2018. 
  4. a b «Elon Musk has poached a top mind in AI research—from himself». 21 June 2017. Consultado el 9 August 2018. 
  5. «Tesla's Autopilot chief steps down after two years». 26 April 2018. Consultado el 9 August 2018. 
  6. «A.I. Researchers Leave Elon Musk Lab to Begin Robotics Start-Up». 7 November 2017. Consultado el 9 August 2018. 
  7. «A.I. Researchers Are Making More Than $1 Million, Even at a Nonprofit». 19 April 2017. Consultado el 9 August 2018. 
  8. «The Slovak, who leads the development of AI at Tesla, is leaving. It was an honor, says Musk – Živé.sk» (en inglés estadounidense). Consultado el 19 de julio de 2022. 
  9. Živé.sk (25 de junio de 2020). «Šéf AI v Tesle: Rodák zo Slovenska je medzi TOP 35 mladými novátormi». Živé.sk (en eslovaco). Consultado el 19 de julio de 2022. 
  10. today, newsy (28 de marzo de 2022). «The Slovak, who leads AI in Tesla, left the company for several months. He jokes with Musk about TikTok». Newsy Today (en inglés estadounidense). Consultado el 19 de julio de 2022. 
  11. «Slovák Andrej Karpathy z Tesly patrí podľa MIT medzi 35 top inovátorov». TeslaMagazin.sk (en sk-SK). 23 de junio de 2020. Consultado el 19 de julio de 2022. 
  12. a b «Andrej Karpathy Academic Website». cs.stanford.edu (en inglés). Consultado el 12 de noviembre de 2018. 
  13. «Does 'robo-journalism' pose a threat to reporters?». 23 March 2017. Consultado el 9 August 2018. 
  14. a b c d Karpathy, Andrej (7 de septiembre de 2016). Github, ed. «A Survival Guide to a PhD» (en inglés). Consultado el 24 de julio de 2022. «The academic search tools (e.g. arxiv-sanity) are an example - I felt continuously frustrated by the inefficiency of finding papers in the literature and I released and maintain the site in hopes that it can be useful to others.» 
  15. a b c d e Karpathy, Andrej. «Biography» (en inglés). Consultado el 24 de julio de 2022. 
  16. «Tesla hired a top AI expert to lead a critical aspect of Autopilot -- here's what we know». 22 June 2017. Consultado el 9 August 2018. 
  17. Yoney, Domenick (22 de junio de 2021). «Watch Tesla Vision Development Explained By Company's AI Guru». insideevs (en inglés). Consultado el 24 de julio de 2022. «His confidence stems from the advances the company has made with vision. Now, the data returned by the cameras is so superior to that of the radar, the latter is not especially useful. Karpathy points to a tweet from his boss to underline his point: "When radar and vision disagree, which one do you believe? Vision has much more precision, so better to double down on vision than do sensor fusion."». 
  18. Kolodny, Lora (13 de julio de 2022). «Tesla AI leader Andrej Karpathy announces he's leaving the company». CNBC (en inglés). Consultado el 14 de julio de 2022. 
  19. «Innovators Under 35 2020». 
  20. Karpathy, Andrej. «Extracting colors from Rubik's Cube (Computer Vision)» (en inglés). Consultado el 24 de julio de 2022. 
  21. Karpathy, Andrej. «Tetris Artificial Intelligence (AI) #2» (en inglés). Consultado el 24 de julio de 2022. 

Enlaces externos editar