А у нас проекты: poisk.im и telega.fm - вообще левые зоны

Лохматый Осьминог 2026-05-03 16:50

Отчасти они правы Ответить

раскрыть ветку (1)

Призматический Буффало 2026-05-03 17:14

Так там способов 1км, от сокращателей ссылок, до редиретков или хитрых iframe. Ответить

Лохматый Осьминог 2026-05-03 16:51

Началось.
Рассвет эпохи дотрэфов 🤣 Ответить

раскрыть ветку (1)

Лохматый Осьминог 2026-05-03 16:51

Прогрев же Ответить

Раздражительный Жираф 2026-05-03 16:51

чё-то давно новостей про tapki не было Ответить

раскрыть ветку (24)

Автор канала 2026-05-03 16:51

а там тухляк. ничего не происхдит Ответить

раскрыть ветку (23)
- Раздражительный Жираф 2026-05-03 16:52
  
  оно у тебя нигде не происходит, но ты умудряешься высасывать повод. Признайся уже, охладел в детищу и переключился на другого фаворита Ответить
  
  раскрыть ветку (22)
  - Автор канала 2026-05-03 16:53
    
    да. надо признать что проект не взлетел. не страшно. он работает, просто развития нет. мы его не отключаем. Ответить
    
    раскрыть ветку (21)
    - Сквознячный Судья 2026-05-03 17:00
      
      Ответить
      
      раскрыть ветку (20)
      - Раздражительный Жираф 2026-05-03 17:06
        
        это мне кажется проблема многих. Сделать хороший поиск это очень сложная задача. И на мой взгляд, туда вообще не надо идти. Надо было сразу нарезать всё на категории и давать возможность двигаться по уже сформированным группам/кластерам/категориям. Поиск прятать/убирать
        
        Тогда ты
        
        а) всегда можешь оценить качество нарезанных групп/категорий
        
        б) не ебешь мозги с этим поиском, потому что на таком числе документов недостаточно получить вхождение, нужна ещё релевантность, веса, в общем это сложно
        
        иначе пользователь что-то просил, а результат говно Ответить
        
        раскрыть ветку (19)
        
        Автор канала 2026-05-03 17:07
        
        Все так да. Очередная ошибка Ответить
        
        Раздражительный Жираф 2026-05-03 17:11
        
        это я сейчас много работаю с Claude Design, генерю фронтенд для своих SaaS в области разных данных. И он очень часто на первый же экран херачит поисковую строку для пользователя.
        
        И я всегда думаю, бля, поисковая строка под собой это что? Это опять поднимать эластик, это думать что там будет в результатах, это ебала. Я убираю этот поиск и иду по пути категорийной/кластерной механики, потому что понимаю, что поиск будет убогим (в том числе потому что пользователь спрашивает хуй пойми как)
        
        Но может так только у меня в силу отсутствия опыта в поиске Ответить
        
        раскрыть ветку (17)
        
        Автор канала 2026-05-03 17:15
        
        Я думаю надо и так и так. Как хочешь так и ищи Ответить
        
        Пряный Единорог 2026-05-03 18:58
        
        Почему не сделать векторный поиск? Ответить
        
        раскрыть ветку (14)
        
        Раздражительный Жираф 2026-05-03 18:59
        
        мне кажется под этим кроется не один геморроидальный узел Ответить
        
        раскрыть ветку (13)
        
        Пряный Единорог 2026-05-03 19:06
        
        На моих проектах работает очень хорошо. Вот буквально вчера запилил поиск на основе faiss+sqlite. Поиск по 100 миллионам поисковых фраз с метриками CPC, Search Volume, Competition Index, High Bid и т.д. Расчет индекса и формирование базы заняло где-то минут 40. Очень удобно и просто получилось. Ответить
        
        раскрыть ветку (12)
        
        Раздражительный Жираф 2026-05-03 19:06
        
        ну гляну, сохранил в заметки. У меня с поиском плохо, поэтому пока намеренно этот функционал игнорирую. Ответить
        
        раскрыть ветку (11)
        
        Пряный Единорог 2026-05-03 19:58
        
        Поиск 36 миллисекунд Ответить
        
        раскрыть ветку (10)
        
        Раздражительный Жираф 2026-05-03 20:00
        
        так это поиск по одной строке, а если у нас карточка компании, например, то поиск будет идти по названию + описание, там совершенно другой объем
        
        типа у нас 100 млн документов Ответить
        
        раскрыть ветку (9)
        
        Пряный Единорог 2026-05-03 20:08
        
        Зависит от того, что вы векторизуете. Можно одну фразу, можно целые параграфы. В вашем случае в вектор лучше переводить сразу название+описание. В любом случае вектор будет фиксированной длины - массив из 384, 768 или более чисел. Сам поиск по косинусной близости супер быстрый практически на любом объеме, это очень простая математическая операция. Я пробовал и на 7 миллиардах векторов, тоже работает десятки миллисекунд. Ответить
        
        раскрыть ветку (8)
        
        Раздражительный Жираф 2026-05-03 20:12
        
        тут 2 вопроса возникает
        
        1. Нам перед векторизацией надо исходник чистить? Например, у нас была html главная страница сайта. Мы её стрипаем просто от html тегов или прогоняем через что-то типа trafilatura, чтобы извлечь только текст?
        
        2. как быстро мы можем преобразовать 250-300 млн таких документов, ну т.е. примерно все главные страницы интернета без поддоменов? Ответить
        
        раскрыть ветку (7)
        
        Пряный Единорог 2026-05-03 20:33
        
        1. Да, надо векторизовать чистый текст. Если текст большой, его надо резать на чанки с перехлестом на 15-20%.
        2. Допустим, на видеокарте 1 миллион векторов размером 384 моделью e5-small-v2 будет считаться 1 минуту. Соответственно, на 300 миллионов векторов потребуется 5 часов. На CPU будет намного дольше, это мазохизм на таких объемах. Ответить
        
        раскрыть ветку (6)
        
        Раздражительный Жираф 2026-05-03 20:36
        
        ну вот звучит уже непросто, особенно по первому пункту + обработка будет не у себя, т.е. надо будет делать это где-то. Поэтому поиск не кажется простой задачей, это не поиск по wp записям, проще убрать этот функционал и уйти в простую категоризацию, потому что поиск не дает ничего особо по сеошке и выгод коммерческих не чувствуется Ответить
        
        раскрыть ветку (2)
        
        Пряный Единорог 2026-05-03 20:45
        
        А вам, кстати, не нужны домены с живыми беклинками от Википедии, Форбс, Нью-Йорк таймс? Ответить
        
        раскрыть ветку (1)
        
        Раздражительный Жираф 2026-05-03 20:45
        
        да у нас этого добра как говна за баней) Но спасибо) Ответить
        
        Автор канала 2026-05-03 20:42
        
        Главный вопрос - зачем Ответить
        
        раскрыть ветку (2)
        
        Раздражительный Жираф 2026-05-03 20:44
        
        чтобы твои головастики спустили больше бабок на железо и добавили пункт в резюме Ответить
        
        Пряный Единорог 2026-05-03 20:53
        
        Поиск нужен чтобы был поиск. Как это ни странно. Ответить
        
        Взлетающий Продюсер 2026-05-03 19:01
        
        Клод видимо подразумевает, что поиск ты пробросишь ему Ответить

Лохматый Осьминог 2026-05-03 16:53

Ну надо сказать сам на прошлой неделе отдал предпочтение в размещении на баннер домена РФ а не ru или com) Ответить

Сквознячный Судья 2026-05-03 17:00

Так ищет фигово как-то Ответить

раскрыть ветку (1)

Автор канала 2026-05-03 17:06

Вообще оказался не нужен Ответить

Топающий Скелет 2026-05-03 17:15

До сих пор жили не тужили и тут запретили потому что нас хотят "защитить" от недовольства своей никчемной способностью работать Ответить

Пухлый Воробей 2026-05-03 17:25

На vk.com в первую очередь не заходим. Ответить

раскрыть ветку (2)

Лохматый Осьминог 2026-05-03 19:02

vk.ru давно уже функционирует) Ответить

раскрыть ветку (1)
- Пухлый Воробей 2026-05-03 20:22
  
  Попробуйте контент через поисковик к vk.ru найти, очень удивитесь, особенно видео. Ответить

А у нас проекты: poisk.im и telega.fm - вообще левые зоны

Комментарии (36)