Anuncios

Aprender a ver con Deep Learning: Nuevos fundamentos para la visión por computadora

Descarga gratis Deep Learning to See - libro sobre visión por computadora con nuevos principios basados en movimiento

La inteligencia artificial está cambiando cómo las máquinas aprenden a ver. Hoy te presentamos un libro gratuito que puedes descargar desde nuestro sitio: Deep Learning to See: Towards New Foundations of Computer Vision.

Esta obra presenta ideas nuevas y diferentes sobre cómo enseñar a las computadoras a procesar imágenes y videos.

Los autores Alessandro Betti, Marco Gori y Stefano Melacci proponen algo diferente en Deep Learning to See. En lugar de usar miles de imágenes etiquetadas para entrenar máquinas, sugieren que el movimiento debe ser la base del aprendizaje visual. Esta idea se inspira en cómo los animales y humanos desarrollan naturalmente sus habilidades para ver.

El libro explica que los métodos actuales de deep learning hacen el problema más difícil de lo necesario. Los animales no necesitan ver millones de fotos para aprender a reconocer objetos. En cambio, usan el movimiento y el tiempo para entender su entorno visual.

Contenido del Libro

Esta obra introduce dos principios básicos para la percepción visual:

  • Principio de Invarianza de Puntos Materiales: Los objetos mantienen su identidad cuando se mueven, lo que permite reconocerlos sin necesidad de muchas imágenes de entrenamiento.
  • Principio de Invarianza de Movimiento Acoplado: Los objetos ganan funcionalidad a través de su interacción con otros objetos en movimiento. Por ejemplo, una silla se entiende como algo para sentarse cuando vemos a una persona usándola.

El libro también explora redes neuronales que imitan el ojo humano, con su capacidad de enfocar la atención en diferentes áreas. Presenta una teoría que conecta las características visuales con sus velocidades de movimiento.

Índice del Libro

Capítulo 1: El movimiento es el protagonista de la visión

  • Introducción
  • El panorama general
  • El aprendizaje supervisado como protocolo artificial
  • Separándose del reconocimiento de patrones
  • Trabajando con video en lugar de imágenes
  • Diez preguntas para una teoría de la visión

Capítulo 2: Foco de atención

Anuncios


  • Introducción
  • ¿Cómo pueden los humanos etiquetar píxeles semánticamente?
  • Perspectivas de la evolución del sistema visual animal
  • ¿Por qué el foco de atención?
  • ¿Qué impulsa los movimientos oculares?
  • El ciclo virtuoso del foco de atención

Capítulo 3: Principios de invarianza de movimiento

  • Introducción
  • Modelos computacionales en entornos espaciotemporales
  • Identidad de objeto y funcionalidad
  • De puntos materiales a píxeles
  • El principio de invarianza de puntos materiales
  • El principio de invarianza de movimiento acoplado
  • Conexión de campos de visión

Capítulo 4: Redes neuronales con foco variable

  • Introducción
  • ¿Por qué campos receptivos y arquitecturas jerárquicas?
  • ¿Por qué dos corrientes principales diferentes?
  • Redes con foco variable y resolución adaptable

Capítulo 5: Leyes de aprendizaje basadas en información

  • El caso más simple de conjugación de características
  • Representación de red neuronal del campo de velocidad
  • Un modelo dinámico para características y velocidades conjugadas
  • Aprendizaje en línea
  • Aprendizaje en línea: perspectiva de teoría de control óptimo
  • ¿Por qué la visión del bebé es borrosa?

Capítulo 6: Interacciones ambientales no visuales

  • Reconocimiento de objetos y habilidades visuales relacionadas
  • ¿Cuál es la interacción con el lenguaje?
  • La perspectiva “al aire libre”

Apéndice A: Cálculo de Variaciones

  • Funcionales integrales y ecuaciones de Euler

Datos del Libro

  • Título: Deep Learning to See: Towards New Foundations of Computer Vision
  • Autores: Alessandro Betti, Marco Gori, Stefano Melacci
  • Categorías: Visión por Computadora, Deep Learning, Inteligencia Artificial
  • Licencia: Acceso libre (publicado por Springer)
  • Idioma: Inglés
  • Editorial: Springer Nature
  • Año de Publicación: 2022
  • Páginas: 106 páginas + referencias e índice

Este libro es ideal para investigadores, estudiantes y profesionales que quieren entender mejor los fundamentos teóricos de la visión por computadora. Las ideas presentadas pueden cambiar cómo desarrollamos sistemas de visión artificial en el futuro.

¡Descarga ahora este recurso valioso y aprende sobre las nuevas bases de la visión por computadora!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *