LLVM (anteriormente conocido como Low Level Virtual Machine, o Máquina Virtual de Bajo Nivel) es una infraestructura para desarrollar compiladores, escrita a su vez en el lenguaje de programación C++, que está diseñada para optimizar el tiempo de compilación, el tiempo de enlazado, el tiempo de ejecución y el "tiempo ocioso" en cualquier lenguaje de programación que el usuario quiera definir. Implementado originalmente para compilar C y C++, el diseño agnóstico de LLVM con respecto al lenguaje, y el éxito del proyecto han engendrado una amplia variedad de lenguajes, incluyendo Objective-C, Fortran, Ada, Haskell, bytecode de Java, Python, Ruby, ActionScript, GLSL, Clang, Rust, Gambas y otros.

LLVM
Información general
Tipo de programa Compilador
Desarrollador LLVM Developer Group
Lanzamiento inicial 24 de octubre de 2003
Licencia University of Illinois/NCSA Open Source License y Apache License v2.0 with LLVM Exceptions
Estado actual En desarrollo
Información técnica
Programado en C++, C y lenguaje ensamblador
Plataformas admitidas Multiplataforma, NetBSD, FreeBSD, OpenBSD, Linux, MINIX 3, Microsoft Windows e Illumos
Versiones
Última versión estable 18.1.4 (info) ( 16 de abril de 2024)
Enlaces

El proyecto LLVM comenzó en 2000 en la Universidad de Illinois en Urbana-Champaign, bajo la dirección de Vikram Adve y Chris Lattner. LLVM fue desarrollado inicialmente bajo la Licencia de código abierto de la Universidad de Illinois, una licencia de tipo BSD. En 2005, Apple Inc. contrató a Lattner y formó un equipo para trabajar en el sistema de LLVM para varios usos dentro de los sistemas de desarrollo de Apple.[1]​ LLVM es parte integrante de las últimas herramientas de desarrollo de Apple para Mac OS X e iOS.[2]

El nombre "LLVM" era en principio las iniciales de "Low Level Virtual Machine", pero esta denominación causó una confusión ampliamente difundida, puesto que las máquinas virtuales son solo una de las muchas cosas que se pueden construir con LLVM. Cuando la extensión del proyecto se amplió incluso más, LLVM se convirtió en un proyecto paraguas que incluye una multiplicidad de otros compiladores y tecnologías de bajo nivel, haciendo el nombre aún menos adecuado. Por tanto, el proyecto abandonó[3]​ las iniciales. Actualmente, LLVM es una "marca" que se aplica al proyecto paraguas, la representación intermedia LLVM, el depurador LLVM, la biblioteca estándar de C++ definida por LLVM, etc.

Descripción editar

LLVM suministra las capas intermedias de un sistema de compilado completo, tomando el código en lenguaje intermedio llamado "forma intermedia" (también conocida como IF, por sus siglas en inglés, de Intermediate Form) de un compilador y emitiendo un IF optimizado. Este nuevo IF puede ser convertido y enlazado en un código ensamblador dependiente de la máquina concreta para una plataforma objetivo. LLVM puede aceptar el IF generado por la cadena de herramientas GCC, permitiendo así que sea utilizado con todos los lenguajes que a su vez son aceptados por GCC.

LLVM también puede generar código máquina relocalizable en el momento de compilación o de enlazado, o incluso código máquina binario en el momento de ejecución.

LLVM permite un conjunto de instrucciones y sistema de tipos independientes del lenguaje. Cada instrucción está en una forma estática de asignación única (SSA, en inglés, static single assignment), es decir, que cada variable (llamado un registro tipado) es asignada una sola vez y congelado. Esto ayuda a simplificar el análisis de las dependencias entre variables. LLVM permite que el código sea compilado estáticamente, al igual que lo es bajo el sistema GCC tradicional, o por el contrario que se deje para una compilación tardía desde la IF a código máquina en una compilación en tiempo de ejecución de manera similar a como lo hace Java. El sistema de tipos consiste de tipos básicos como entero, números de coma flotante y cinco tipos de datos compuestos (en inglés): punteros, vectores, matrices, tuplas y funciones. Un constructo tipado en un lenguaje concreto puede ser representado combinando estos tipos básicos en LLVM. Por ejemplo, una clase en C++ puede ser representada por una combinación de estructuras, funciones y matrices de punteros a funciones.

El compilador de tiempo de ejecución puede optimizar ramales estáticos no utilizados de un programa durante la ejecución, y por tanto es útil para la evaluación parcial en los casos en los que un programa tiene muchas opciones, muchas de las cuales pueden ser determinadas como innecesarias en un entorno específico. Esta característica es usada en la pipeline de OpenGL en el Mac OS X Leopard (v10.5) para proporcionar soporte a características ausentes del hardware.[4]​ El código de gráficos dentro de la pila de OpenGL se dejó en forma intermedia, y después compilado cuando se ejecuta en la máquina de destino. En sistemas con GPUs de gama alta, el código resultante era bastante escaso y redirigía las instrucciones a la GPU con cambios mínimos. En sistemas con GPUs de gama baja, LLVM compilaba procedimientos opcionales para que se ejecutaran en la unidad central de procesamiento (CPU) local que emularan las instrucciones que la GPU no podía ejecutar internamente. LLVM mejoró el rendimiento de las máquinas de gama baja que usaban conjuntos de chips Intel GMA. Un sistema similar fue desarrollado bajo la Gallium3D LLVMpipe e incorporado en la shell de GNOME para permitir que se ejecute sin una GPU.[5]

Por contraste, en los casos en que el rendimiento puro es medido como referencia, LLVM 2.9 va por detrás de GCC 4.6.1 en calidad del código, entendida como velocidad de los programas compilados, en torno al 10% de media, a la vez que compila de 20 a 30% más rápido.[6][7]

Frontales editar

LLVM fue escrito originalmente como un sustituto de un generador de código ya existente dentro de la pila GCC,[8]​ y muchos de los frontales para GCC han sido modificados para trabajar con él. Algunos de los frontales actualmente incluidos en LLVM fueron derivados de las versiones 4.0.1 y 4.2 de la GNU Compiler Collection.

El amplio interés que ha recibido LLVM ha llevado a una serie de tentativas para desarrollar frontales totalmente nuevos para una variedad de lenguajes. El que ha recibido la mayor atención es Clang, un nuevo compilador que soporta C, Objective-C y C++. Apoyado principalmente por Apple, Clang aspira a reemplazar al compilador de C y Objective-C en el sistema GCC con un sistema más moderno que sea más fácil de integrar con entornos de desarrollo integrado (IDEs), y que tenga un soporte más amplio para multihilo. El desarrollo de Objective-C bajo GCC estaba estancado y los cambios de Apple en el lenguaje eran soportados en una rama mantenida por separado. Crear su propio compilador les permitió abordar muchos de los mismos problemas que LLVM abordó para la integración con IDEs y otras características modernas, a la vez que hacer la rama principal de desarrollo la rama de implementación de Objective-C.

El compilador de Haskell de Utrecht puede generar código para LLVM que, a pesar de que el generador está en las primeras etapas de desarrollo, ha demostrado en varias ocasiones ser más eficiente que el generador de código C.[9]​ El Glasgow Haskell Compiler (GHC) tiene un sistema de back-end de LLVM en funcionamiento que consigue una aceleración del 30% en el código compilado comparado con código nativo compilado mediante GHC o generación de código C seguida de compilación, faltando solo una de las muchas técnicas de optimización realizadas por GHC.[10]

Existen muchos otros componentes en varios estados de desarrollo; incluyendo, sin ser exhaustivos, un frontal para bytecode de Java, un frontal para CPython[11]​ la implementación de Ruby 1,9 para Mac (MacRuby), varios frontales para Standard ML, y un nuevo asignador de registros de coloración de grafos.

Véase también editar

Referencias editar

  1. Adam Treat (19 de febrero de 2005). «mkspecs and patches for LLVM compile of Qt4». Archivado desde el original el 4 de octubre de 2011. Consultado el 27 de enero de 2012. 
  2. Apple (ed.). «Apple LLVM Compiler». Developer Tools. Consultado el 27 de enero de 2012. 
  3. «Chris Lattner discusses the name LLVM». Archivado desde el original el 12 de enero de 2012. Consultado el 22 de diciembre de 2011. 
  4. Chris Lattner (15 de agosto de 2006). «A cool use of LLVM at Apple: the OpenGL stack». LLVMdev mailing list. Archivado desde el original el 20 de julio de 2011. Consultado el 26 de octubre de 2009. 
  5. Michael Larabel, "GNOME Shell Works Without GPU Driver Support", phoenix, 6 de noviembre de 2011
  6. V. Makarov. «SPEC2000: Comparison of LLVM-2.9 and GCC4.6.1 on x86». Consultado el 3 de octubre de 2011. 
  7. V. Makarov. «SPEC2000: Comparison of LLVM-2.9 and GCC4.6.1 on x86_64». Consultado el 3 de octubre de 2011. 
  8. Lattner, Chris; Vikram Adve (Mayo de 2003). Architecture For a Next-Generation GCC. First Annual GCC Developers' Summit. Consultado el 6 de septiembre de 2009. 
  9. «Compiling Haskell to LLVM». Consultado el 22 de febrero de 2009. 
  10. «LLVM Project Blog: The Glasgow Haskell Compiler and LLVM». Consultado el 13 de agosto de 2010. 
  11. «unladen-swallow - A faster implementation of Python». Consultado el 7 de mayo de 2009. 

Enlaces externos editar