«Анатомия» рассылок или исповедь спамера — часть 2

Действие шестое: Жизнь каждого — это его личное дело,
а не запрограммированный «умными»
дядями алгоритм прыжка из влагалища в могилу.

Алгоритмы, алгоритмы… итак, как я и писал выше ко мне обратилась одна местная производственная компания с желанием быстро донести до массы потенциальных партнеров информацию о своей продукции. Что я успешно и проделал. Попутно занялся анализом. Оказалось, что рассылать гигабайты писем в сутки не такое просто дело, как это кажется на первый взгляд. Даже соблюдая описанные стандартами требования MX, PTR, SPF, DKIM, нельзя гарантировать что рассылка пройдет успешно. После того как я стал потихоньку разбираться в этой кухне, мне было смешно читать в интернетах объявления о рассылке по базам в 250к-500к в сутки за 1500 руб с гарантированным результатом!!! Кто и как интересно этот результат будет гарантировать. И дело тут не в том, что технически это невозможно, возможно, но себестоимость такой рассылки с хоть какой то гарантией результата будет в десятки раз выше, т.к приходится брать во внимание то что у каждой крупной почтовой системы, будь то mail.ru, yandex.ru, и т.д помимо стандартных декларированных рекомендациями в rfc проверок, используются не postfix-ы exim-ы exchang-ы а самописанные smtp сервисы, во вторых хитрые алгоритмы обработки почты и антиспам фильтры, анализ работы коих хоть и возможен, но вызывает определенные трудности. В общем несколько рассылок я провел и без понимания этих вещей, базы были небольшие не более 2-3к, рассылал медленно с таймаутами со своей VPS.

Действие седьмое: Мне кажется, что процессом эволюции управляет какой-то инженер от Бога. Поэтому на свете есть жирафы, бегемоты и гонорея.

Через пару недель у меня появился еще один клиент на рассылки, строительная компания. Особо заморачиваться с выборкой потенциальных  клиентов они не стали, чем усложнили мне задачу, рассылку необходимо было сделать по Красноярску и Абакану, а это уже более 25к адресов. Я недолго думая взялся за работу. Заработанные деньги с прошлых рассылок ушли на личные нужды и оплату парсера 2GIS, я все таки его купил за 4к, и спарсил базы всех доступных городов, как оказалось вовремя. Буквально через пару месяцев 2GIS спешно выпилил из своего онлайн справочника все email, а именно оттуда они и парсились. Немного позже, вышла обновленная версия, он умел ходить по сайтам в контактах организации и дергать email оттуда, но это уже было совсем не то. Моя рассыльная машина все также состояла из арендованной VPS и рассыльщика на shell script, но сделав некоторые выводы из прошлых рассылок я занялся модернизацией. Во первых, добавил рэндомизацию темы и тела письма, точнее некий хитрый финт, письма получились как будто бы адресованными конкретной организации, и это сработало. Выглядела тема примерно так RE: Для ООО»Лютик» RE: Для «ЗАО ГАЗПРОМ» и т.д рассыльщик дергал адреса из первой колонки название организации из второй. В итоге 23к писем удалось протолкнуть без явных проблем, анализируя log postfix и reply можно было сказать что 85% писем как минимум легли по ящикам в папку входящие. Клиент через пару дней отзвонился и сказал что результатом доволен, звонков получил как минимум несколько десятков. В этот момент я уже подумал что открыл вечный двигатель, но как оказалось рано радовался…

Действие восьмое: Главное в шахматах это не то, на сколько ходов вперед ты думаешь, а то, как ты анализируешь текущую ситуацию.

Через некоторое время появился еще один клиент, человеку требовалась рассылка по всей базе юр лиц. Красноярска но обязательное условие письмо в html формате. Мой скриптовый sender не позволял такое и поэтому пришлось прикупить специализированный софт, к тому же мне нужна была нормальная рэндомизация и подстановки не только для темы писем, но и по тексту, а также возможность работы через несколько smtp одновременно, на тот момент я развернул еще одну VPS. Остановился в итоге на epochta mailer, приемлемая цена и наличие необходимых функций. Макет для рассылки сверстал знакомый фрилансер, и я принялся за работу. И тут что то сломалось, рассылка ушла в никуда. Я начал потихоньку разбирать полеты, и после пары тройки десятков экспериментов вывел некоторые алгоритмы и цифры. Во-первых базы изначально разбираем по почтовым системам, то есть отдельно mail.ru, yandex.ru, rambler.ru, google.com, yahoo.com и отдельно корпоративные для этих нужд, я использовал опять же софт от epochta. Во-вторых, избавляемся от невалидов, т.е несуществующих доменов, доменов без MX записей, несуществующих ящиков на доменах. Здесь надо брать во внимание, что не все почтовые системы позволяют проверить существование ящика, например smtp даемон mail.ru  на любые RCPT TO ответит кодом 250 ОК, вот такая хитрая фича, так что в его случае такие проверки бесполезны.  Также при валидации ящиков корпоративного сегмента, принимаем во внимание Greylisting, SBL, DKIM, SPF и прочие хитрости т.к настройка каждого сервера в этом сегменте заведомо уникальна и зависит от paranoidal/skillmasters администратора его обслуживающего )  Почему удобно раскидывать базы таким образом, по крайней мере для меня, потому что проще в случае fuckup-а проанализировать что пошло не так, и проще подобрать алгоритм рассылки и обойти ловушки.

Продолжение следует…

Смотрите так же:

«Анатомия» рассылок или исповедь спамера — часть 2: 6 комментариев

  1. Данный пост реально помог мне принять очень важное для себя решение. За что автору отдельное спасибо. Жду от Вас новых постов!

  2. Как же вы задолбали, спамеры млин. Неужели нельзя было чем то общественно полезным заняться?

    1. Возможно вы правы, но вы не на моем месте а я не на вашем. Поэтому все эти моральные составляющие очень относительны.

  3. Пиши давай, интересно чего там дальше. И тут это… я походу или у тебя поинтересуюсь как это делается все в подробностях, или обращусь за услугами ))) Есть у меня одна необходимость…

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.