4.7. Полноценный калькулятор
Последняя версия нашего калькулятора может считать сложные выражения, но чтобы он имел практическую ценность, этого мало. В этом разделе мы научим наш калькулятор использовать функции и переменные. Также будет введена операция возведения в степень, обозначающаяся значком "^
".
Имена переменных и функций — это идентификаторы. Идентификатор определяется по общепринятым правилам: он должен начинаться с буквы латинского алфавита или символа "_
", следующие символы должны быть буквами, цифрами или "_
". Таким образом, грамматика идентификатора выглядит так.
Следствием этой грамматики является то, что отдельно взятый символ "_
" считается корректным идентификатором. И хотя это может на первый взгляд показаться абсурдным, тем не менее, именно таковы общепринятые правила. Легко убедиться, что, например, Delphi допускает объявление переменных с именами "_
", "__
" и т. п.
В нашей грамматике переменной будет называться отдельно стоящий идентификатор, функцией — идентификатор, после которого в скобках записан аргумент, в качестве которого может выступать любое допустимое выражение (для простоты мы будем рассматривать только функции с одним аргументом, т. к. обобщение грамматики на большее число аргументов очевидно). Другими словами, определение будет выглядеть так:
Из приведенных определений видно, что грамматика, основанная на них, не относится к классу LR(1) — грамматик, т. к. обнаружив в выражении идентификатор, анализатор не может сразу решить, является ли этот идентификатор переменной или именем функции, это выяснится только при проверке следующего символа — скобка это или нет. Тем не менее реализация такой грамматики достаточно проста, и это не будет доставлять нам существенных неудобств.
Переменные и функции, так же, как и выражения, заключенные в скобки, выступают в роли множителей. Соответственно, их появление в грамматике учитывается расширением смысла символа
.
'('
Теперь рассмотрим свойства оператора возведения в степень. Во-первых, его приоритет выше, чем у операций сложения и деления, т. е. выражение a*b^c
трактуется как a*(b^c)
, а a^b*c
— как (a^b)*c
. Во-вторых, он правоассоциативен, т. е. a^b^c
означает a^(b^c)
, а не (a^b)^c
. В-третьих, его приоритет выше, чем приоритет унарных операций, т. е. -a^b
означает -(a^b)
, а не (-а)^b
. Тем не менее, a^-b
означает a^(-b)
.
Таким образом, мы видим, что показателем степени может быть любой отдельно взятый множитель, а основанием — число, переменная, функция или выражение в скобках, т. е. любой множитель, за исключением начинающегося с унарного оператора. Запишем это в виде БНФ.
Правая ассоциативность также заложена в этих определениях. Рассмотрим, как будет разбираться выражение a^b^c
. Сначала функция Factor
(через вызов функции Base
) выделит и вычислит множитель а, а потом вызовет саму себя для вычисления остатка b^c
. Таким образом, а будет возведено в степень b^c
, как это и требуют правила правой ассоциативности. Вообще, вопросы правой и левой ассоциативности операторов, которые мы здесь опустили, оказывают влияние на то, как определяется грамматика языка. Более подробно об этом написано в [5].
Так как определения символов
и
в нашей новой грамматике не изменились, не изменятся и соответствующие функции. Для реализации нового синтаксиса нам потребуется изменить функцию Factor
и ввести новые функции Base
, Identifier
и Func
(примем такое сокращение, т. к. function
в Delphi является зарезервированным словом). Идентификаторы будем полагать нечувствительными к регистру символов.
Для простоты обойдемся тремя функциями: sin
, cos
и ln
. Увеличение количества функций, допустимых в выражении, — простая техническая задача, не представляющая особого интереса.
Если у нас появились переменные, то мы должны как-то хранить их значения, чтобы при вычислении выражения использовать их. В нашем примере мы будем хранить их в объекте типа TStrings
, получая доступ через свойство Values
. С точки зрения производительности, этот способ — один из самых худших, поэтому при создании реального калькулятора лучше придумать что-нибудь другое. Мы здесь выбрали этот способ исключительно из соображений наглядности. Получившийся в итоге код показан в листинге 4.9.
// вычисление функции, имя которой передается через FuncName