Русский ИТ бизнес 👨
Подписаться
Заказ был в xmldatafeed.com - дали на вход пачку доменов в разных зонах США + EU и нужно было найти все почты (контактные) и телефоны. Справились с грехом пополам :)

Вообще тема интересная, перспективная, продуктовая на 1000%, правда и конкуренция высокая... Попросили 18к за в месяц за плюс- минус регулярный обход пачек доменов. Это не много, но нам надо научиться делать это системно и без ошибок - потом, может быть, и продукт появился :)

Русский ИТ бизнес

Комментарии (0)

  • dmitry236
    Макс, ну можно же было email адреса привести к строчным буквам и оставить только уникальные, у тебя же повторы из за этого media@RealPage.com, Media@RealPage.com

    И не надо говорить, что не всё сразу, это база: сел срать - снимай штаны, трусы
  • SVRyzhov
    Как определяли какой страны номер телефона в универсальных доменных зонах? А-то в европах часто без кода телефоны пишут.
    • dmitry236
  • rznvlxndr
    Чет у games2win не все собрали)
  • SVRyzhov
    Распознавал текст в таблице при помощи перплексити. 18 строка, 2 раза не правильно распознавалась. Вот не нравится ии этот домен.
  • genesem
    30 июля гугл выкатил LangExtract: A Gemini powered information extraction library.
    Библиотека для вытаскивания не структурированной информации.
    Правда это python.