Evolución del índice de datos de la cadena de bloques: del nodo a los servicios de cadena completos habilitados por IA

Evolución de la tecnología de indexación de datos de la cadena de bloques: del nodo a los servicios de datos de toda la cadena potenciados por IA

1. Introducción

Desde que se lanzaron las primeras aplicaciones descentralizadas (dApp) en 2017, el ecosistema de la cadena de bloques ha crecido rápidamente, y diversas dApps han florecido en diferentes cadenas públicas. Al discutir estas aplicaciones descentralizadas, ¿hemos considerado alguna vez la fuente de los diversos datos que utilizan?

En 2024, la inteligencia artificial y Web3 se convierten en temas candentes. En el campo de la IA, los datos son como la fuente vital del crecimiento y la evolución de los sistemas inteligentes. Así como las plantas necesitan luz solar y agua para crecer fuertes, los sistemas de IA también requieren enormes cantidades de datos para "aprender" y "pensar" continuamente. Sin el apoyo de datos, incluso el algoritmo de IA más sofisticado tiene dificultades para demostrar su inteligencia y eficacia adecuadas.

Este artículo analizará en profundidad la evolución del índice de datos de cadena de bloques en el proceso de desarrollo de la industria desde la perspectiva de la accesibilidad de los datos de la cadena de bloques, y comparará y analizará las similitudes y diferencias entre los protocolos de índice de datos tradicionales y los nuevos protocolos de servicio de datos de cadena de bloques en la arquitectura de servicios y productos de datos, prestando especial atención a las innovaciones que traen los nuevos protocolos combinados con tecnologías de IA.

2. La complejidad y simplicidad de la indexación de datos: de los nodos de la cadena de bloques a la base de datos de toda la cadena

2.1 Fuente de datos: Nodo de cadena de bloques

La esencia de la cadena de bloques es un libro mayor distribuido y descentralizado. Los nodos de la cadena de bloques son la base de toda la red, responsables de registrar, almacenar y difundir todos los datos de transacciones en la cadena. Cada nodo guarda una copia completa de los datos de la cadena de bloques para mantener la característica descentralizada de la red. Sin embargo, para los usuarios comunes, construir y mantener un nodo de la cadena de bloques no es tarea fácil, ya que no solo se necesita tecnología especializada, sino que también se enfrenta a altos costos de hardware y ancho de banda. Al mismo tiempo, la capacidad de consulta de los nodos comunes es limitada, lo que dificulta satisfacer las necesidades de los desarrolladores en cuanto a formatos de datos. Por lo tanto, aunque teóricamente todos pueden operar un nodo, en la práctica los usuarios tienden a depender de servicios de terceros.

Para resolver este problema, el proveedor de nodos de llamada a procedimientos remotos RPC( nació. Estos proveedores asumen los costos y la gestión de los nodos, proporcionando servicios de acceso a datos a los usuarios a través de puntos finales RPC. Esto permite a los usuarios acceder fácilmente a los datos de la cadena de bloques sin necesidad de construir nodos propios. Aunque los puntos finales RPC públicos son gratuitos, tienen limitaciones de tasa que pueden afectar la experiencia del usuario de dApp. Los puntos finales RPC privados ofrecen un mejor rendimiento, pero aún son ineficientes para consultas complejas y tienen una escalabilidad y compatibilidad entre redes deficientes. A pesar de esto, la interfaz API estandarizada de los proveedores de nodos ha reducido la barrera de acceso de los usuarios a los datos en la cadena, sentando las bases para el posterior análisis de datos y aplicaciones.

) 2.2 Análisis de datos: de datos en bruto a datos utilizables

Los datos obtenidos de los nodos de la cadena de bloques suelen ser datos en bruto que han sido cifrados y codificados. Aunque estos datos garantizan la integridad y la seguridad de la cadena de bloques, también aumentan la dificultad de la interpretación de los datos. Para los usuarios comunes o los desarrolladores, manejar directamente estos datos en bruto requiere una gran cantidad de conocimientos técnicos y recursos computacionales.

En este contexto, el proceso de análisis de datos se vuelve especialmente importante. Al convertir datos brutos complejos en un formato más comprensible y manejable, los usuarios pueden aprovechar estos datos de manera más intuitiva. La calidad del análisis de datos afecta directamente la eficiencia y efectividad de las aplicaciones de datos de la Cadena de bloques, siendo un eslabón clave en todo el proceso de indexación de datos.

2.3 La evolución del indexador de datos

Con el crecimiento de la cantidad de datos en la cadena de bloques, la demanda de indexadores está aumentando. Los indexadores juegan un papel clave en la organización de los datos en la cadena y en su envío a la base de datos para consultas. El funcionamiento de un indexador consiste en indexar los datos de la cadena de bloques y hacer que los datos estén siempre disponibles a través de lenguajes de consulta similares a SQL ### como GraphQL API (. Al proporcionar una interfaz de consulta de datos unificada, los indexadores permiten a los desarrolladores recuperar rápidamente y con precisión la información necesaria utilizando un lenguaje de consulta estandarizado, lo que simplifica enormemente el proceso.

Los diferentes tipos de indexadores utilizan diversas formas de optimizar la recuperación de datos:

  1. Indexador de nodo completo: extrae datos directamente de nodos de cadena de bloques completos, asegurando que los datos sean completos y precisos, pero requiere una gran capacidad de almacenamiento y procesamiento.

  2. Indexador ligero: depende de nodos completos para obtener datos específicos bajo demanda, reduce la necesidad de almacenamiento pero puede aumentar el tiempo de consulta.

  3. Indexador especializado: optimizado para tipos de datos específicos o cadenas de bloques específicas, como datos de NFT o transacciones de DeFi.

  4. Agregador de índices: extrae datos de múltiples cadenas de bloques y fuentes ), incluyendo información fuera de cadena (, proporcionando una interfaz de consulta unificada, especialmente útil para dApps multichain.

Actualmente, los requisitos de almacenamiento de los nodos de archivo de Ethereum varían de 3TB a 13.5TB en diferentes clientes, y continúan aumentando a medida que crece la cadena de bloques. Frente a tal cantidad de datos, los protocolos de indexación más comunes no solo admiten la indexación de múltiples cadenas, sino que también han personalizado marcos de análisis de datos para satisfacer las necesidades de datos de diferentes aplicaciones.

En comparación con los puntos finales RPC tradicionales, los indexadores mejoran significativamente la eficiencia de indexación y consulta de datos. Pueden indexar eficientemente grandes volúmenes de datos, soportar consultas complejas de alta velocidad y filtrar y analizar datos fácilmente. Algunos indexadores también soportan la agregación de múltiples fuentes de datos de cadenas de bloques, evitando el problema de que las dApps de múltiples cadenas necesiten desplegar múltiples API. A través de la ejecución distribuida, los indexadores proporcionan una mayor seguridad y rendimiento, reduciendo el riesgo de interrupciones que pueden surgir de proveedores RPC centralizados.

El indexador permite a los usuarios acceder directamente a la información que necesitan sin tener que lidiar con los complejos datos subyacentes a través de un lenguaje de consulta predefinido. Este mecanismo mejora significativamente la eficiencia y la fiabilidad de la recuperación de datos, siendo una innovación importante en el campo del acceso a datos de la cadena de bloques.

![Leer, indexar y analizar, breve descripción de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-694cb5f2be61475195e2e559567dee89.webp(

) 2.4 Base de datos de cadena completa: alineación prioritaria hacia el flujo

Consultar datos utilizando nodos índice a menudo significa que la API se convierte en el único canal para procesar datos en la cadena. Sin embargo, cuando los proyectos entran en la fase de escalado, a menudo se requieren fuentes de datos más flexibles, algo que las API estandarizadas tienen dificultades para proporcionar. A medida que las demandas de las aplicaciones se vuelven más complejas, los indexadores de datos primarios y sus formatos de índice estandarizados gradualmente se vuelven insuficientes para satisfacer las crecientes y diversificadas demandas de consulta, como búsqueda, acceso entre cadenas o mapeo de datos fuera de la cadena.

En la arquitectura moderna de tuberías de datos, el enfoque "prioridad de flujo" se ha convertido en una solución para abordar las limitaciones del procesamiento por lotes tradicional, permitiendo la ingestión, procesamiento y análisis de datos en tiempo real. Este cambio de paradigma permite a las organizaciones responder de inmediato a los datos entrantes, lo que les permite obtener información y tomar decisiones casi en tiempo real. De manera similar, el desarrollo de los proveedores de servicios de datos de cadena de bloques también avanza hacia la construcción de flujos de datos de cadena de bloques. Los proveedores de servicios de indexación tradicionales han lanzado productos que obtienen datos de cadena de bloques en tiempo real en forma de flujo de datos, como lagos de datos en tiempo real basados en flujos de datos.

Estos servicios están diseñados para abordar la necesidad de analizar transacciones de la cadena de bloques en tiempo real y proporcionar capacidades de consulta más completas. Así como la arquitectura "prioridad de flujo" ha revolucionado la forma en que se procesan y consumen los datos en los tradicionales canales de datos al reducir la latencia y mejorar la capacidad de respuesta, estos proveedores de servicios de flujo de datos de cadena de bloques también esperan apoyar el desarrollo de más aplicaciones y ayudar en el análisis de datos en la cadena a través de fuentes de datos más avanzadas y maduras.

Desde la perspectiva de los modernos canales de datos, redefinimos los desafíos de los datos en la cadena. Esto nos permite ver todo el potencial de la gestión, almacenamiento y provisión de datos en la cadena desde una nueva perspectiva. Cuando comenzamos a considerar los indexadores como Subgraph y Ethereum ETL como flujos de datos dentro de los canales de datos en lugar de salidas finales, podemos imaginar un mundo posible donde se pueden personalizar conjuntos de datos de alto rendimiento para cualquier caso de uso empresarial.

![Leer, indexar a analizar, breve descripción de la pista de indexación de datos Web3]###https://img-cdn.gateio.im/webp-social/moments-587ce87f6dbedee4acec7d939fed6980.webp(

3. ¿IA + Base de datos? Comparación profunda de los tres principales protocolos de índice de datos

) 3.1 El Gráfico

La red The Graph implementa servicios de indexación y consulta de datos multichain a través de una red de nodos descentralizados, facilitando a los desarrolladores la indexación de datos de la cadena de bloques y la construcción de aplicaciones descentralizadas. Su principal modelo de producto incluye un mercado de ejecución de consultas de datos y un mercado de caché de indexación de datos, que esencialmente sirven a las necesidades de consulta de productos de los usuarios.

El subgráfico es la estructura de datos básica en la red The Graph, que define cómo extraer y transformar datos de la cadena de bloques en un formato que se puede consultar. Cualquiera puede crear un subgráfico, y múltiples aplicaciones pueden reutilizar estos subgráficos, mejorando la reutilización de datos y la eficiencia de uso.

La red The Graph se compone de cuatro roles clave: indexadores, curadores, delegadores y desarrolladores, que juntos proporcionan soporte de datos para aplicaciones web3. Entre ellos, los indexadores son responsables de la indexación y el procesamiento de consultas, los delegadores apuestan tokens GRT para apoyar la operación de los nodos de indexación, los curadores son responsables de señalar qué subgráficas deben ser indexadas con prioridad, mientras que los desarrolladores son los principales usuarios, creando y enviando subgráficas a la red.

Actualmente, The Graph se ha trasladado a un servicio de alojamiento de subgráficas completamente descentralizado, donde los incentivos económicos circulantes entre los diferentes participantes aseguran el funcionamiento del sistema. Los nodos de índice ganan ingresos a través de tarifas de consulta y recompensas en tokens, y los delegadores y curadores también pueden obtener parte de las recompensas.

Los productos de The Graph también están evolucionando rápidamente en la ola de la IA. Herramientas como AutoAgora, Allocation Optimizer y AgentC, desarrolladas por Semiotic Labs, han mejorado el rendimiento del ecosistema en múltiples aspectos, como la fijación de precios dinámica, la asignación optimizada de recursos y las consultas en lenguaje natural. La aplicación de estas herramientas ha permitido que The Graph, al combinarse con la IA, mejore aún más la inteligencia del sistema y la facilidad de uso para los usuarios.

![Lectura, indexación para análisis, breve descripción de la pista de indexación de datos Web3]###https://img-cdn.gateio.im/webp-social/moments-cf9a002b9b094fbbe3be7f611001b5c1.webp(

) 3.2 Chainbase

Chainbase es una red de datos de cadena completa que integra todos los datos de la cadena de bloques en una plataforma, facilitando a los desarrolladores construir y mantener aplicaciones. Sus funciones destacadas incluyen:

  • Lago de datos en tiempo real: proporciona un lago de datos en tiempo real diseñado específicamente para flujos de datos de cadena de bloques, lo que permite que los datos sean accesibles de inmediato.

  • Arquitectura de doble cadena: construida sobre la capa de ejecución de Eigenlayer AVS, formando una arquitectura de doble cadena paralela con el algoritmo de consenso CometBFT, lo que mejora la programabilidad y la combinabilidad de los datos entre cadenas.

  • Estándares de formato de datos innovadores: se introduce el estándar de formato de datos "manuscripts", optimizando la estructuración y el uso de datos en la industria de criptomonedas.

  • Modelo del mundo criptográfico: combinando la tecnología de modelos de IA, se ha creado un modelo de IA capaz de comprender, predecir las transacciones de la cadena de bloques y interactuar con ellas. Actualmente, se ha lanzado el modelo básico Theia para uso público.

El modelo de IA Theia de Chainbase es un punto destacado que lo diferencia de otros protocolos de servicios de datos. Theia se basa en el modelo DORA de NVIDIA, combinando datos en cadena y fuera de cadena, así como actividades espaciales y temporales, para aprender y analizar patrones criptográficos, respondiendo a través de inferencia causal, y excavando en profundidad el valor y las reglas potenciales de los datos en cadena, proporcionando a los usuarios servicios de datos más inteligentes.

![Lectura, indexación y análisis, breve descripción de la pista de indexación de datos Web3]###https://img-cdn.gateio.im/webp-social/moments-b343cab5112c1a3d52f4e72122ae0df2.webp(

) 3.3 Espacio y Tiempo

Space and Time ###SxT( se dedica a crear una capa de computación verificable, expandiendo pruebas de conocimiento cero sobre un almacén de datos descentralizado, para proporcionar procesamiento de datos confiable a contratos inteligentes, modelos de lenguaje grande y empresas.

En el campo de la indexación y validación de datos, Space and Time ha introducido una innovadora tecnología de Proof of SQL. Esta es una técnica de prueba de conocimiento cero que asegura que las consultas SQL ejecutadas en un almacén de datos descentralizado son a prueba de manipulaciones y verificables. Al consultar, Proof of SQL genera una prueba criptográfica que verifica la integridad y precisión de los resultados de la consulta. Este enfoque cambia el desperdicio de recursos de múltiples nodos que indexan los mismos datos bajo mecanismos de consenso tradicionales, mejorando el rendimiento general del sistema.

SxT colabora estrechamente con el laboratorio de innovación de IA de Microsoft para acelerar el desarrollo de herramientas de IA generativa, facilitando a los usuarios el procesamiento de datos de la cadena de bloques a través del procesamiento de lenguaje natural. En Space and Time Studio, los usuarios pueden ingresar consultas en lenguaje natural, la IA las convertirá automáticamente en SQL y ejecutará la consulta, presentando el resultado final que el usuario necesita.

![Leer, indexar y analizar, resumen de la pista de indexación de datos Web3])https://img-cdn.gateio.im/webp-social/moments-97443cbd177ac4ffd1665da670ffbf12.webp(

Conclusión y perspectivas

La tecnología de indexación de datos de la cadena de bloques ha evolucionado desde la fuente de datos del nodo inicial, pasando por el desarrollo de la解析 de datos y del indexador, hasta convertirse finalmente en un servicio de datos de toda la cadena potenciado por inteligencia artificial, atravesando un proceso de mejora gradual. La continua evolución de estas tecnologías no solo ha mejorado la eficiencia y precisión del acceso a los datos, sino que también ha brindado a los usuarios una experiencia de inteligencia sin precedentes.

Mirando hacia el futuro, con el continuo desarrollo de nuevas tecnologías como la tecnología AI y las pruebas de conocimiento cero, los servicios de datos de la cadena de bloques se volverán aún más inteligentes y seguros. Tenemos razones para creer que los servicios de datos de la cadena de bloques seguirán desempeñando un papel importante como infraestructura en el futuro, brindando un fuerte apoyo para el progreso y la innovación en la industria.

![Leer, indexar para analizar, resumen de la pista de indexación de datos Web3])https://

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 2
  • Republicar
  • Compartir
Comentar
0/400
rekt_but_resilientvip
· hace14h
La IA que mira los artículos ha llegado de nuevo.
Ver originalesResponder0
NotSatoshivip
· hace18h
Esta ola de IA tiene un buen espectáculo por ver.
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)