Palona passe à la verticale, lance sa vision et propose un flux de travail : 4 leçons clés pour les créateurs d’IA

Construire une entreprise d’IA d’entreprise sur une « fondation de sable mouvant » est aujourd’hui le défi central pour les fondateurs, selon les dirigeants. favoriser.

Aujourd’hui, la startup basée à Palo Alto, dirigée par d’anciens vétérans de Google et de la méta-ingénierie, fait une avancée verticale décisive dans le secteur de la restauration et de l’hôtellerie avec le lancement aujourd’hui de Palona Vision et Palona Workflow.

Les nouvelles offres transforment la suite d’agents multimodaux de l’entreprise en un système d’exploitation en temps réel pour la gestion des restaurants : caméras, appels, conversations et exécution coordonnée.

Cette nouvelle marque un tournant stratégique pour l’entreprise qui devrait faire ses débuts début 2025, lors de sa première apparition. Le financement de démarrage est de 10 millions de dollars Créer des agents commerciaux émotionnellement intelligents pour de vastes initiatives directes avec le consommateur.

Désormais, en se concentrant sur une approche « multimodale native » pour les restaurants, Palona fournit un modèle aux développeurs d’IA sur la façon d’aller au-delà du « mince emballage » pour créer des systèmes profonds qui résolvent des problèmes physiques à enjeux élevés.

“Vous construisez une entreprise sur une base qui n’est pas constituée de sables mouvants, mais de sables mouvants”, déclare le co-fondateur et directeur technique Tim Hawes, faisant référence à la volatilité de l’écosystème LLM actuel. “Nous avons donc construit une couche d’orchestration qui nous permet d’échanger des modèles en termes de performances, d’agilité et de coût.”

VentureBeat s’est récemment entretenu personnellement avec House et la co-fondatrice et PDG Maria Zhang à propos de — où d’autre ? – un restaurant à New York sur les défis technologiques et les dures leçons tirées de leur lancement, de leur croissance et de leur pivotement.

Nouvelle offre : vision et flux de travail en tant que « GM numérique »

Pour l’utilisateur final, le propriétaire ou l’exploitant du restaurant, la dernière version de Palona est conçue pour agir comme un « meilleur gestionnaire des opérations » automatisé qui ne dort jamais.

Palona Vision utilise des caméras de sécurité en magasin pour analyser les signaux opérationnels – tels que la longueur de la file d’attente, la rotation des tables, les goulots d’étranglement lors de la préparation et la propreté – sans nécessiter de nouveau matériel.

Il surveille les mesures en amont telles que la longueur de la file d’attente, la rotation des tables et la propreté, tout en identifiant également les problèmes en arrière-plan tels que les ralentissements de préparation ou les erreurs de configuration des stations.

Palona Workflow complète cela en automatisant les processus opérationnels en plusieurs étapes. Cela comprend la gestion des commandes de restauration, l’ouverture et la fermeture des listes de contrôle et la préparation des repas. En corrélant les signaux vidéo de la vision avec les données du point de vente (POS) et les niveaux de personnel, le flux de travail garantit une exécution cohérente sur plusieurs sites.

“La vision de Palona revient à donner à chaque site un directeur général numérique”, a déclaré Shaz Khan, fondateur de Tono Pizzeria + Cheesestex, dans un communiqué de presse à VentureBeat. “Cela signale les problèmes avant qu’ils ne s’aggravent et me fait gagner des heures chaque semaine.”

Passer à la verticale : leçons sur les compétences du domaine

Le voyage de Palona a commencé avec une liste de stars. Le PDG Zhang était auparavant vice-président de l’ingénierie chez Google et CTO de Tinder, tandis que le co-fondateur House est le co-inventeur de LDAP et un ancien CTO de Netscape.

Malgré ce pedigree, la première année de l’équipe a été une leçon sur le besoin de concentration.

Initialement, Palona était au service des marques de mode et d’électronique, créant des personnages de « sorcier » et de « surfeur » pour stimuler les ventes. Cependant, l’équipe s’est vite rendu compte que l’industrie de la restauration représentait une opportunité unique, d’une valeur de mille milliards de dollars, « remarquablement résistante à la récession », mais « abasourdie » par des inefficacités opérationnelles.

“Conseil aux fondateurs de startups : ne vous lancez pas dans le multi-industrie”, prévient Zhang.

Grâce à la verticalisation, Palona est passée d’une couche de discussion « fine » à la construction d’un « pipeline d’informations multisensorielles » qui traite simultanément la vue, la voix et le texte.

Cette clarté d’orientation accède à des données de formation exclusives (telles que les manuels de préparation et les transcriptions d’appels) pour éviter le grattage de données courant.

1. Bâtir sur du « sable mouvant »

Pour s’adapter à la réalité des déploiements d’IA en entreprise en 2025 – avec de nouveaux modèles améliorés publiés presque chaque semaine – Palona a développé une couche d’orchestration en instance de brevet.

Au lieu d’être « groupé » avec un seul fournisseur comme OpenAI ou Google, l’architecture de Palona leur permet d’échanger des modèles à un prix modique en fonction des performances et du coût.

Ils utilisent un mélange de modèles propriétaires et open source, notamment Gemini pour les tests de vision par ordinateur et des modèles linguistiques spécifiques pour la maîtrise de l’espagnol ou du chinois.

Pour les fabricants, le message est clair : ne laissez pas la dépendance à un seul fournisseur devenir la valeur fondamentale de votre produit.

2. Du mot « modèle mondial »

L’introduction de Palona Vision représente un passage d’une bonne compréhension à la compréhension de la réalité d’une cuisine.

Alors que de nombreux développeurs ont du mal à assembler des API disparates, le nouveau modèle de vision de Palona transforme les caméras existantes en magasin en assistants opérationnels.

Le système détecte les « causes et effets » en temps réel – alertant un gérant si une pizza est insuffisamment cuite grâce à sa couleur « faux beige » ou si une vitrine est vide.

“En termes simples, la physique n’a pas d’importance”, a expliqué Zhang. “Mais en réalité, je lâche le téléphone, ça tombe toujours… On a vraiment envie de savoir ce qui se passe dans ce monde de la restauration”.

3. La solution « Muffin » : architecture de mémoire personnalisée

L’un des obstacles techniques les plus importants concerne la gestion de la mémoire. Dans un contexte de restaurant, la mémoire fait la différence entre une interaction frustrante et une interaction « magique » où l’agent se souvient d’une commande « normale » pour un dîner.

L’équipe a initialement utilisé un outil open source non spécifié, mais a constaté qu’il produisait des erreurs dans 30 % des cas. “Je pense que les développeurs de conseils désactivent toujours la mémoire (dans les produits d’IA grand public), car cela risquerait de tout gâcher”, a prévenu Zhang.

Pour résoudre ce problème, Palona a créé Muffin, un système propriétaire de gestion de la mémoire dont le nom est un clin d’œil aux « cookies » du Web. Contrairement aux approches vectorielles standard qui ont du mal à gérer les données structurées, Muffin est conçu pour gérer quatre couches distinctes :

  • Données structurées : données statiques telles que l’adresse de livraison ou les informations sur les allergies.

  • Dimensions qui changent progressivement : préférences de fidélité et articles favoris.

  • Mémoire transitoire et saisonnière : s’adapter aux changements comme préférer les boissons froides en juillet au chocolat chaud en hiver.

  • Contexte régional : valeurs par défaut telles que le fuseau horaire ou les préférences linguistiques.

La leçon pour les fabricants : si le meilleur outil disponible n’est pas assez performant pour votre secteur d’activité spécifique, vous devez être prêt à créer le vôtre.

4. Fiabilité grâce à «GRACE»

Dans une cuisine, une erreur d’IA n’est pas seulement une faute de frappe ; Il s’agit d’une commande inutile ou d’un risque pour la sécurité. Un incident récent Stefanina’s Pizzeria dans le Missouri, où une hallucination d’IA simule des offres pendant le rush du dînerCela montre à quelle vitesse la confiance dans la marque peut s’évaporer en l’absence de garanties.

Pour éviter un tel chaos, les ingénieurs de Palona suivent ses composants internes Le cadre GRACE:

  • Garde-corps : contraintes strictes sur le comportement des agents pour empêcher toute propagation non autorisée.

  • Red Teaming : efforts proactifs pour « casser » l’IA et identifier d’éventuels déclencheurs d’hallucinations.

  • App Sec : verrouillez les API et les intégrations tierces avec des mécanismes TLS, de tokenisation et de prévention des attaques.

  • Conformité : base chaque réponse sur des données de menu vérifiées et validées pour garantir l’exactitude.

  • Escalade : acheminer les interactions complexes vers un responsable humain avant qu’un invité ne reçoive des informations incorrectes.

Cette fiabilité est vérifiée par des simulations approfondies. “Nous avons simulé un million de façons de commander une pizza”, a déclaré Zhang, en utilisant une IA pour agir en tant que client et une autre pour prendre la commande, mesurant la précision pour éliminer les hallucinations.

Conclusion

Avec le lancement de Vision et Workflow, Palona parie que l’avenir de l’IA d’entreprise ne réside pas dans de vastes assistants, mais dans des « systèmes d’exploitation » spécialisés capables de voir, d’entendre et de penser dans un domaine spécifique.

Contrairement aux agents IA à usage général, le système de Palona est conçu pour piloter les flux de travail des restaurants, pas seulement pour répondre aux questions : il est capable de se souvenir des clients, d’écouter leurs commandes « normales » et de surveiller les opérations du restaurant pour s’assurer qu’ils livrent de la nourriture à ce client conformément à leurs processus et directives internes, en signalant chaque fois que quelque chose ne va pas ou est critique. à propos avoir tort

Pour Zhang, l’objectif est d’amener les opérateurs humains à se concentrer sur leur métier : “Si vous avez réussi ce plat délicieux… nous vous dirons quoi faire.”

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici