nickita startcev (nicka_startcev) wrote,
nickita startcev
nicka_startcev

Categories:

дыбр

я вот тут немного в ахуе.

озаботился поисками химических справочников, и.. и...

и нашел только кривые сканы.
рабинович, никольский, лурье -- есть только в виде нераспознанных сканов. искать в них неудобно, сравнивать - тем более.

собственно вопрос - это я плохо искал, или бигдата такая бигдата, что реальную дату совсем не затрагивает?

ps: подумал даже, мельком, а не сделать ли мне нейросеть для распознавания такого рода литературы -- сначала разбиваем на символы, потом вероятностно опознаем буквы, потом вероятностно опознаём слова, и только на этом этапе делаем текст плюс этакую корректорскую хрень с исходной картинкой рядом.

но там трудоёмкость, навскидку, будет нереальной.


pps: а что хотелось -- просто корпус текстов, по которым полнотекстовым поиском можно найти, например, растворимость сульфата натрия в воде и разночтения этой величины в разных справочниках разных авторов разных изданий.
Subscribe

  • (no subject)

    если подумать, если с нуля при современных возможностях спроектировать а не по мелочи подпатчить, то очень многое в жизни станет резко дешевле и…

  • а вот я бы, если бы был вчера таким умным как ?? сегодня..

    а вот любопытно. допустим, вы попали в на 20-30-40-50 лет назад. помните-знаете про пейсбук, ютуб, жж и прочие блоги. как бы вы описали тенденции и…

  • электрофобийное

    внезапно, я боюсь стандартного напряжения 220/240в. осмысленно боюсь. оно неприятно бьёт и рикошетит дергающимися мышцами. итого, при любом…

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 5 comments