¿Quién es Andrei Karpatía? - MBA de cuatro semanas


Andrej Karpathy es un científico informático apasionado por el entrenamiento de redes neuronales profundas en grandes conjuntos de datos. Mejor conocido por sus papeles protagónicos en OpenAI y Tesla, también diseñó y dirigió el primer curso de aprendizaje profundo en la Universidad de Stanford.

Echemos un vistazo a los logros de Karpathy hasta ahora.

Educación e Investigación

Karpathy estudió para su doctorado. Recibió su doctorado en informática de la Universidad de Stanford entre 2011 y 2016. Su disertación trató sobre la creación de nuevas redes neuronales recurrentes y convolucionales (CNN) y su uso en PNL y visión por computadora.

Durante décadas, los científicos han tratado de enseñar a las computadoras a ver, pero pocos se han acercado más que Karpathy.

Combinó las CNN con otros enfoques para permitir que las computadoras vean objetos individuales (por ejemplo, un gato), pero también la escena completa de los objetos y cómo interactúan; en otras palabras, se vio que el gato tenía pelaje marrón y estaba en una patineta, por ejemplo. , un piso de madera pasó sobre él.

En 2015, Karpathy se convirtió en el instructor principal del primer curso de aprendizaje profundo de Stanford. Noble Redes neuronales convolucionales para el reconocimiento visualDesde entonces, el curso se ha convertido en uno de los cursos relacionados con la IA más populares que se ofrecen.

IA abierta

Después de graduarse de la universidad, Karpathy se unió a OpenAI como uno de los investigadores fundadores. Ayudó con el reclutamiento y la estructuración desde el principio, pero luego trabajó en el aprendizaje de refuerzo profundo y el aprendizaje profundo para modelos generativos.

Entre otras cosas, Karpathy entrenó una computadora que controla un teclado y un mouse para completar varias tareas en línea, como completar un formulario. Sin embargo, se fue después de 18 meses para unirse a Tesla después de que, según los informes, fue cazado furtivamente por su miembro fundador de OpenAI, Elon Musk.

tesla

Karpathy ha estado involucrado en varios proyectos de IA en Tesla. En particular, trabajó en el piloto automático de Tesla, un sistema de hardware entrenado en una red neuronal desarrollada por la empresa que proporciona funciones avanzadas para la seguridad y comodidad del conductor.

Para crear esta experiencia de conducción casi autónoma, Karpathy supervisó los esfuerzos para recopilar y etiquetar datos, entrenar la red neuronal e implementarla con éxito utilizando segmentación, detección, 3D o estimación de profundidad, y más.

A medida que Tesla amplió Autopilot para incluir una gama más amplia de IA, Karpathy se convirtió en director sénior de IA.

También trabajó con Musk en el robot humanoide Optimus, que debutó en el Tesla AI Day 2022. El robot que Musk afirmó podría ser 'vendido al público'probablemente menos de $ 20,000', integró muchas de las características y sensores de Autopilot.

Volver a OpenAI

Karpathy anunció en Twitter en febrero de 2023 que volvería a OpenAI: "Como muchos otros, tanto dentro como fuera de la IA, estoy muy inspirado por el impacto de su trabajo y personalmente me he beneficiado mucho de él.

Revista de análisis de la India no estaba sorprendido por el movimiento, ya que Karpathy y OpenAI habían reconocido públicamente el trabajo del otro en un intercambio de opiniones después de lanzar ChatGPT.

inicio de perspectiva de acuerdo, pero por diferentes razones: "El enfoque de Karpathy en el código abierto y la educación se alinea con la misión de OpenAI, por lo que es natural que regrese a la empresa.

Las tesis centrales:

  • Andrej Karpathy es un científico informático apasionado por el entrenamiento de redes neuronales profundas en grandes conjuntos de datos. Mejor conocido por sus papeles protagónicos en OpenAI y Tesla, también diseñó y dirigió el primer curso de aprendizaje profundo en la Universidad de Stanford.
  • Después de graduarse de la universidad, Karpathy se unió a OpenAI como uno de los investigadores fundadores. Ayudó con el reclutamiento y la estructuración desde el principio, pero luego trabajó en el aprendizaje de refuerzo profundo y el aprendizaje profundo para modelos generativos.
  • Karpathy luego se unió a Tesla después de ser cazado furtivamente por Elon Musk. Allí trabajó en el robot humanoide Optimus y en los esfuerzos de conducción autónoma de Tesla bajo el lema Autopilot. Inspirado por el trabajo de la empresa, anunció en febrero de 2023 que volvería a OpenAI.

Leer más: Historia de OpenAI, modelos de negocio de IA, economía de IA.

Análisis del modelo de negocio en red

Paradigma de IA

Paradigma actual de IA

Pre-entrenamiento

Pre-entrenamiento

Modelos de lenguaje grande

Modelos de lenguaje grande LLMS
Los modelos de lenguaje grande (LLM) son herramientas de IA que pueden leer, resumir y traducir texto. Esto les permite predecir palabras y formar oraciones que reflejan la forma en que las personas escriben y hablan.

Modelos Generativos

modelos generativos

Ingeniería rápida

pronta ingenieria
La ingeniería rápida es un concepto de procesamiento del lenguaje natural (NLP) que implica identificar entradas que producen resultados deseables o útiles. Como ocurre con la mayoría de los procesos, la calidad de las entradas también determina la calidad de las salidas en la ingeniería rápida. El diseño de avisos efectivos aumenta la probabilidad de que el modelo devuelva una respuesta tanto afirmativa como contextual. El modelo de preentrenamiento de imágenes y lenguaje contrastivo (CLIP) desarrollado por OpenAI es un ejemplo de un modelo que utiliza indicaciones para clasificar imágenes y leyendas de más de 400 millones de pares de leyendas e imágenes.

Estructura organizativa de OpenAI

estructura organizativa openai
OpenAI es un laboratorio de investigación de inteligencia artificial que se transformó en una organización con fines de lucro en 2019. Su estructura corporativa consta de dos entidades: OpenAI, Inc., una LLC de Delaware de un solo miembro controlada por la organización sin fines de lucro OpenAI, y OpenAI LP, una organización de responsabilidad limitada con fines de lucro. OpenAI LP está gobernado por la Junta Directiva de OpenAI, Inc (la Fundación), que actúa como Socio General. Al mismo tiempo, los socios limitados incluyen empleados de LP, algunos miembros de la junta y otros inversionistas como la organización benéfica de Reid Hoffman, Khosla Ventures y Microsoft, el principal inversionista de LP.

Modelo de negocio de IA abierta

¿Cómo gana dinero Openai?
OpenAI ha construido la capa base de la industria de la IA. Con grandes modelos generativos como GPT-3 y DALL-E, OpenAI proporciona acceso a la API para las empresas que desean desarrollar aplicaciones basadas en sus modelos básicos mientras pueden integrar esos modelos en sus productos y utilizar esos modelos con datos patentados e IA adicional. personalizar características. Por otro lado, OpenAI también lanzó ChatGPT, que se basa en un modelo freemium. Microsoft también comercializa productos Opener como parte de su asociación comercial.

OpenAI/Microsoft

openai-microsoft
Desde un punto de vista comercial, OpenAI y Microsoft se asociaron. La historia de la asociación comenzó en 2016 y se solidificó en 2019 cuando Microsoft invirtió mil millones de dólares en la asociación. Ahora está dando un gran paso adelante: Microsoft está negociando para invertir $10 mil millones en esta asociación. Microsoft está desarrollando su supercomputadora Azure AI a través de OpenAI mientras mejora su plataforma empresarial Azure e integra los modelos OpenAI en sus productos comerciales y de consumo (GitHub, Office, Bing).

Modelo de negocio de IA de estabilidad

Cómo-Estabilidad-AI-Dinero
Stability AI es el motor detrás de Stable Diffusion. Stability gana dinero con nuestros productos de IA y proporciona servicios de consultoría de IA a las empresas. Stability AI monetiza Stable Diffusion a través de las API de DreamStudio. Al mismo tiempo, también se lanza como una versión de código abierto para que cualquiera pueda descargarla y usarla. Stability AI también gana dinero con los servicios empresariales, donde su equipo de desarrollo central brinda a los clientes empresariales la capacidad de mantener, escalar y personalizar Stable Diffusion u otros modelos generativos grandes para satisfacer sus necesidades.

Estabilidad del ecosistema de IA

Estabilidad del ecosistema de IA


Si quieres conocer otros artículos parecidos a ¿Quién es Andrei Karpatía? - MBA de cuatro semanas puedes visitar la categoría Negocios Online.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir